AIMS Study Blog

평균과 중앙값 본문

통계

평균과 중앙값

호우루기 2023. 2. 25. 16:21

기술 통계학을 공부할 때 빼놓을 수 없는 것이 평균이다. 가지고 있는 데이터의 크기가 작다면 표로 정리해서 전체 데이터를 보여주면 된다. 그러나, 데이터가 크다면 데이터를 나열한 것만 보고는 데이터의 특성을 알기 쉽지 않다. 그래서 데이터의 특징을 한눈에 보여주기 위해 가장 많이 쓰는 대표값이 평균이다. 데이터의 평균을 구해서 데이터가 대충 어느 지점에 분포가 되어 있는지 파악할 수 있기 때문이다. 그런데 평균의 문제가 있다. 예건대 특정 기업의 평균 월급을 공개했다고 하자. 그 평균 월급이 800만원인 것을 보고 사람들은 해당 기업의 월급이 굉장히 높다고 생각한다. 하지만 함정이 있다. 평균을 구한 그 월급 데이터에는 회사의 임원부터 시작해서 회장까지 있다는 것이다. 평사원과는 굉장히 차이가 나는 고위급 임직원들의 월급까지 평균 계산에 사용되었기 때문에 평균월급이 높아진 것이다. 그런 극단값이 존재할 때는 평균보다는 중앙값을 사용한다. 중앙값은 데이터를 크기 순으로 놓았을 때 가장 가운데에 있는 값이다. 그래서 극단값과 같은 이상치에 영향을 받지 않게 된다. 

 

면접에서 평균과 중앙값 중에 어떤 케이스에서 뭐를 써야 할까요?라는 질문을 받았다면,

극단값이 없는 경우 평균을 쓰면 되지만, 극단값이 있는 경우 극단값에 영향을 받지 않는 중앙값을 사용합니다. 라고 답변하면 될 것 같다. 

'통계' 카테고리의 다른 글

중심극한정리  (0) 2023.02.26
평균(Mean)과 중앙값(Median)  (0) 2023.02.26
R square 의 의미  (0) 2023.02.18
R제곱에 대하여  (0) 2023.02.18
A/B Test  (0) 2023.02.18
Comments