통계

신뢰구간이란?

hyenzzang 2023. 1. 31. 08:02
Q. 신뢰 구간의 정의는 무엇인가요? 

 

신뢰구간 (Confidence Interval, CI)

  • 신뢰구간은 실제 모수가 포함될 것으로 예측되는 범위를 뜻한다. 이를 통해 샘플링된 표본이 연구중인 모집단을 얼마나 잘 대표하는지 측정할 수 있다.
  • 신뢰구간이 좁을 수록 모평균의 추정치가 정확해진다. 또한 일반적으로 샘플 크기가 클 수록 신뢰 구간이 좁아진다.
  • 신뢰수준은 어떤 값이 알맞은 추정값이라고 믿을 수 있는 정도를 나타내며, 일반적으로 95% 신뢰 수준이 사용된다.
    • 95% 신뢰수준이라하면, 샘플을 랜덤하게 추출해 신뢰구간을 구하는 일을 20번 반복할 때, 그 중 한번은 신뢰구간 안에 모집단의 평균이 없을 수도 있음을 뜻한다.

 

  • 신뢰구간의 계산은 아래와 같은 방식으로 할 수 있다.
    • 관측 개수 (n), 평균 (X), 표준 편차 (s)를 구한다.
      • 예를 들어, n = 40, X=160, s=20이라 하자.
    • 신뢰 수준에 대한 Z-Score을 이용한다.
      • 95% 에 대한 Z-Score 는 1.96
      • 90%는 1.645, 99%는 2.58이다.
    • 아래 공식을 사용하여 신뢰 구간을 계산할 수 있다.

  • 최종적으로 아래와 같이, 모집단의 평균이 153.8 ~ 166.2 의 신뢰할 수 있는 구간에 있을 거라 추정할 수 있다.
    • 오차 한계는 6.20이다.

 

 

Summary

  • 신뢰 구간이란, 샘플링 된 데이터를 통해 모수의 범위를 추정하기 위해 사용된 수치로, 모수 (모평균)가 실제로 포함될 거라 예측되는 범위를 나타낸다. 신뢰구간이 좁을 수록 모평균 추정치가 정확해진다. 덧붙여 신뢰수준은 어떤 값이 알맞은 추정값이라 믿을 수 있는 정도를 나타내는 값이다. 예를 들어 95% 신뢰수준은 샘플을 추출해 신뢰구간을 구하는 일을 20번 반복할 때, 그 중 한 번은 신뢰 구간 안에 모평균이 없을 수도 있음을 나타낸다.

 

Reference

https://bioinformaticsandme.tistory.com/256

https://www.datadata.link/qa04/