일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 신뢰구간
- 베타분포
- Transformer
- 확률모형
- 통계면접
- 모평균
- 통계
- 고유벡터
- 확률분포
- 검정력
- 모집단
- 고유값
- 누적분포함수
- 조건부확률
- p-value
- 검정
- 공분산
- ViT
- 확률변수
- 평균
- 데이터분석
- 상관계수
- 확률밀도함수
- 표본
- 샘플링
- 리샘플링
- 선형대수
- 확률
- 데이터분석면접
- Self-attention
- Today
- Total
AIMS Study Blog
신뢰 구간 본문
Q. 신뢰 구간의 정의는 무엇인가요?
신뢰 구간이란?
실생활에서는 모집단 전체에 대한 분석이 어렵기 때문에 우리는 일반적으로 샘플링된 표본 데이터를 기반으로 분석한다.
신뢰 구간(Confidence Interval)은 샘플링된 데이터를 기반으로 모수의 범위를 추정하기 위해 사용되는 방법이다.
신뢰 구간에 모집단 실제 평균값이 포함될 확률을 '신뢰 구간의 신뢰 수준(Confidence level)'이라고 하며,
신뢰 구간 관련 문제를 풀 때 나오는 95%, 99% 같은 수치가 이 신뢰 수준에 해당한다.
신뢰 수준이 낮을수록 신뢰 구간의 범위는 넓어진다.
신뢰 구간은 다음의 수식으로 표현된다.
$$\bar{X}\pm Z\frac{s}{\sqrt{n}}$$
이때 $\bar{X}$는 평균, $Z$는 신뢰 수준에 해당하는 Z-score (주로 문제에서 표로 제시됨), $s$는 표준 편차, 그리고 $n$은 관측 데이터 수를 의미한다.
즉, 모평균은 신뢰 수준의 확률로 $\bar{X} - Z\frac{s}{\sqrt{n}}$과 $\bar{X} + Z\frac{s}{\sqrt{n}}$ 사이의 값을 가진다.
위의 식에서 알 수 있듯이, 표본의 크기($n$)가 클수록 신뢰 구간이 좁아지기 때문에
표본이 클수록 더 정확하게 모집단의 평균을 추정할 수 있다.
요약하자면,
신뢰 구간은 샘플링된 데이터를 기반으로 모수의 범위를 추정하기 위해 사용되는 방법으로 모집단의 실제 평균이 포함될 범위를 신뢰 수준을 이용하여 계산한다.
신뢰 구간은 표본의 수에 따라 그 폭이 정해지는데, 표본의 수가 많을수록 신뢰 구간이 좁아지기 때문에 더 정확하게 모평균을 추정할 수 있다.
References
- https://m.blog.naver.com/iotsensor/222182891116
- https://angeloyeo.github.io/2021/01/05/confidence_interval.html
- https://bioinformaticsandme.tistory.com/256
'통계' 카테고리의 다른 글
신뢰구간이란 (0) | 2023.02.05 |
---|---|
공분산과 상관계수 (0) | 2023.02.05 |
공분산과 상관계수 (0) | 2023.02.05 |
공분산(Covariance)과 상관계수(Correlation Coefficient) (0) | 2023.02.05 |
신뢰 구간 (Confidence Interval) (0) | 2023.02.05 |