Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 고유값
- 확률분포
- 검정력
- 데이터분석
- 선형대수
- 누적분포함수
- 표본
- 모평균
- 조건부확률
- 리샘플링
- 모집단
- 확률밀도함수
- 확률
- 신뢰구간
- 샘플링
- 베타분포
- 확률변수
- 확률모형
- 평균
- 상관계수
- 통계
- ViT
- 공분산
- 검정
- Self-attention
- 통계면접
- Transformer
- 데이터분석면접
- p-value
- 고유벡터
Archives
- Today
- Total
AIMS Study Blog
p-value는 정말로 유효할까? 본문
p-value는 요즘 시대에도 여전히 유효할까요? 언제 p-value가 실제를 호도하는 경향이 있을까요?
앞선 포스팅에 설명했듯이, 가설검정을 하기 위해 통계학에서 p-value를 계산한다. 또한 이 값을 이용해 가설의 채택유무를 정한다. 통상적으로 0.05값보다 작으면 유의하다고 간주한다.
p-value의 한계와 악용
p값에는 한계가 여럿 존재하는데, 흔히 알려진 p-value의 한계점은 다음과 같이 두가지가 있다.
첫째, 관측치가 많을수록 p값이 작아진다는 것이다. 표본의 크기가 매우 크면 p값은 작게 나올 수 있다. 임계값에 도달하기 위해서 일부러 관측치를 증가시켜, 억지로 유의하게 만드는 방법이 있다. 이로써 빅데이터 분석에서는 p값이 제 역할을 할 수 없다.
둘째, 선택적으로 p-value와 통계적 방법론을 선택하는 경우. 유의한 p값만을 제시하는 경우가 있다. 유의하지 않은 변수를 제거하고 유의한 변수만 사용해 눈속임이 가능하다. 통계적 방법론 역시 유의한 결과가 나오도록 방법론을 조작하는 경우도 존재한다.
이를 보완하기 위해 신뢰구간을 사용하기도 한다. 신뢰구간은 실험적 처치 효과의 크기, 이를테면 평균 시험점수의 차이 같은 것을 포함한다고 추정되는 범위이다. 신뢰구간은 이 블로그의 다른 포스팅에 있으니 참고하자.
ref
'통계' 카테고리의 다른 글
R square란? (0) | 2023.02.13 |
---|---|
P-value의 유효성 (0) | 2023.02.13 |
p-value에 대해서 (0) | 2023.02.11 |
p-value 고객에게 설명하기 (0) | 2023.02.11 |
p-value가 여전히 유효할까? (0) | 2023.02.09 |
Comments