AIMS Study Blog

평균(Mean)과 중앙값(Median) 본문

통계

평균(Mean)과 중앙값(Median)

김랑명 2023. 2. 26. 22:06
평균(Mean)과 중앙값(Median) 중에 어떤 케이스에서 뭐를 써야 할까요?

 

 

평균(Mean)

모든 관측값의 합을 개수로 나눈 것, 평균 근처에 표본이 있다면 경향성을 파악하기 좋다. 다만 outlier에 영향을 크게 받기 때문에 잘못된 결과가 나올 수도 있다.

 

중앙값(Median)

전체 관측값을 크기 순서로 배열했을 때 중앙에 위치한 값으로 가운데에 위치하는 값 이외에 다른 값들의 영향을 받지 않습니다. 따라서 outlier에 민감하지 않고, 왜곡이 심한 데이터에 유용합니다. 

 

위 사진처럼 a의 경우에는 데이터의 분포가 정규분포와 가깝기 때문에 평균, 중앙값이 동일하지만, b, c와 같이 분포의 모양이 비대칭인 경우에는 중앙값을 사용하는 것이 유용합니다.

'통계' 카테고리의 다른 글

정보 엔트로피와 정보 이득(Information Gain)  (0) 2023.03.12
중심극한정리  (0) 2023.02.27
중심 극한 정리  (0) 2023.02.26
산술 평균과 중앙값  (0) 2023.02.26
중심극한정리  (0) 2023.02.26
Comments