통계

신뢰 구간 (Confidence Interval)

김랑명 2023. 2. 5. 10:11
신뢰구간이란 무엇인가요?

 

1. 신뢰 구간(Confidence Interval)

통계학에서 신뢰 구간 (Confidence Interval)은 모수가 어느 범위 안에 있는지를 확률적으로 보여주는 방법이다.

집단 전체를 연구하는 것은 불가능하므로 샘플링된 데이터를 기반으로 모수의 범위를 추정하기 위해 사용된다.

신뢰 구간은 샘플링된 표본이 연구중인 모집단을 얼마나 잘 대표하는지 측정하는 방법이고, 신뢰구간(CI)에 따라 모집단 실제 평균값이 포함될 확률을  'CI의 신뢰수준(Confidence Level)'이라 한다.

일반적으로 95%의 신뢰수준이 사용된다.

 

표본 평균 분포 모양을 잘 보면 정규분포 모양을 하고 있는데, 정규분포에서 평균값을 중심으로 2 * 표준편차의 범위는 약 95%의 면적을 차지한다.

 

구하는 방법으로는 관측개수 n, 평균 x, 표준편차 s를 구하고, 신뢰 수준에 대한 Z-Score를 사용한다(일반적으로 95% 또는 99%에 해당하는 Z-Score 사용). 이후 공식을 사용해 신뢰 구간(Confidence Interval)을 계산하게 된다.

 

Reference