일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 샘플링
- 공분산
- 리샘플링
- 고유값
- 확률변수
- p-value
- 데이터분석
- 상관계수
- 조건부확률
- 검정력
- 확률분포
- ViT
- Self-attention
- 확률밀도함수
- 확률모형
- 모평균
- 고유벡터
- 검정
- 통계
- 확률
- 통계면접
- 표본
- Transformer
- 선형대수
- 데이터분석면접
- 모집단
- 베타분포
- 신뢰구간
- 누적분포함수
- 평균
- Today
- Total
목록p-value (4)
AIMS Study Blog
P-value는 항상 유효한가? 유효하지 않을 때는 언제인가? P-value를 사용할 때에는 적절한 표본의 개수가 필요합니다. 데이터가 많아질수록 P-value가 작아지는 경향을 보이기 때문에, 이를 고려해야 합니다. 또한, 여러 항목들을 비교하게 되면, 낮은 P-value 값이 나올 확률이 높고, 표본들의 구성이 한쪽으로 치우쳐져 있다면, P-value를 구하더라도, 변수들간의 관계를 정확하게 반영하지 못할수도 있습니다. 교란 변수, 즉 두 변수에 모두 영향을 미치지만, 우리가 알고 싶어하는 정보와 상관이 없는 요소가 존재하는 경우에는 이 교란변수의 영향을 통제하는 작업을 해야 하는데, 만약 하지 않았다면, P-value의 결과가 교란 변수의 영향인 것인지, 아니면 오직 두 변수의 관계를 통해서 나온 ..

통계 면접 질문 두 가지를 가지고 왔습니다. - p-value를 고객에게는 뭐라고 설명하는 게 이해하기 편할까요? - p-value는 요즘 시대에도 여전히 유효할까요? 언제 p-value가 실제를 호도하는 경향이 있을까요? 이 두 질문은 p-value에 관한 질문입니다. 두 질문 모두 p-value에 대한 통계적인 자세한 내용보다는, 실용적인 측면에서의 질문 느낌이 납니다. 그래도 p-value에 대해서 정확히 알아야 위 두 질문에 대답할 수 있을 것입니다. 따라서 우선적으로 p-value에 대해서 알아보겠습니다. p-value의 p는 다름이 아닌 probability의 p입니다. 즉, 확률 값이 p-value입니다. 무엇의 확률 값인지가 중요합니다. 이 무엇을 알기 위해서는 통계적 가설 검정을 짚고 넘..
Q. p-value는 요즘 시대에도 여전히 유효할까요? 언제 p-value가 실제를 호도하는 경향이 있을까요? p-value는 귀무가설이 맞다고 가정할 때 얻은 결과보다 극단적인 결과가 실제로 관측될 확률이다. 귀무가설: 통계분석에서 검증하는 가설 대립가설: 새로운 주장 p-value가 작을 수록 관찰된 데이터가 귀무가설과 양립하는 정도가 약하다고 볼 수 있으며 0.05 보다 작을 경우 귀무가설을 관례이다. 그러나 p-value는 몇 가지 한계를 가지고 있다. 관측치가 많아질 수록 p-value 가 작아진다. 관측치를 일부러 많이 증가시켜 유의하게 만드는 경우가 있다. 따라서 빅데이터 분석이 많이 이루어지고 있는 요즘 시대에서의 통계적 유의성을 판단하기 위해 p-value를 사용하는 것은 좋지 않다. 신..
p-value를 고객에게는 뭐라고 설명하는 게 이해하기 편할까요? p-value는 귀무가설(Null Hypothesis)가 맞다는 전제 하에, 통계값이 실제 관측한 값 이상일 확률을 의미한다. 하지만, 이는 수학을 잘 아는 사람에게는 이해가 될 수 있을진 모르지만, 통계 관련 지식이 없는 사람에게 p-value를 어떻게 해야 잘 설명할 수 있을지 고민해보았다. 왜 모분포를 추정해야 하는가? p-value를 구하는 것은 전체 집단(모집단)에서 랜덤하게 표본(sample)을 뽑아서 모집단의 평균을 추정하기 위해서이다. 그러면, "처음부터 모집단을 전부 조사해서(전수 조사) 통계값(평균, 분산 등)을 구하면 되는 것이 아닌가?"라는 의문이 들 수 있다. 하지만, 현실에서는 여러 제약 조건(비용, 시간 문제 등..