일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 모집단
- 통계면접
- 리샘플링
- 고유벡터
- Transformer
- 검정력
- 모평균
- 확률변수
- p-value
- 데이터분석
- 확률밀도함수
- Self-attention
- 상관계수
- 검정
- 확률
- 평균
- 데이터분석면접
- 샘플링
- 누적분포함수
- 확률분포
- 조건부확률
- 확률모형
- 통계
- 공분산
- 고유값
- ViT
- 신뢰구간
- 표본
- 선형대수
- 베타분포
- Today
- Total
AIMS Study Blog
산술 평균과 중앙값 본문
평균 (산술 평균, Arithmetic Mean)
산술 평균은 모든 값들을 다 더한 후에 데이터의 개수로 해당 값을 나눈 값을 의미한다.
일반적으로 가장 많이 사용하는 대표값으로, 모든 값을 다 더한 후에, 데이터의 개수로 해당 값을 나눈 값이라고 볼 수 있다. 이 산술평균의 특성은 크게 다음 3가지로 볼 수 있다.
- 극단적인 값에 민감하다.
- 편차의 합이 0이다.
- 다른 대표값을 사용하여 분산을 계산할 때보다 가장 작은 분산을 가지게 된다.
특히, 극단적인 값에 민감하다는 점으로 인해서 절사평균(Trimmed Mean)을 사용하기도 한다. 이는 극단적인 값은 평균 계산시에 제외를 하고 계산을 진행하여, 실질적인 데이터의 분포를 더 잘 대표할 수 있다는 장점을 가지고 있다.
중앙값(Median)
데이터들을 크기 순서대로 정렬했을 때 중간에 있는 데이터의 값을 의미한다.
산술 평균이 극단적인 값에 영향을 많이 받는 반면, 중앙값은 극단적인 값에 의한 영향을 상대적으로 적게 받는다. 하지만, 산술 평균을 계산할 때와는 달리, 데이터들을 크기 순으로 정렬하는 과정에서 추가적인 계산 비용이 더 들어간다.
산술 평균과 중앙값 외에도 다른 많은 대표값들이 존재한다. 예를 들어 데이터 셋에서 가장 많은 표본들이 가지고 있는 값을 최빈값(Mode)이라고 한다. 그리고, 이 대표값들은 상황에 따라서 어느 대표값에 더 주목을 해야하는지가 달라진다. 또한, 하나의 대표값만을 찾아보기 보다는 여러 대표값들을 통해서 데이터에 대한 정보를 알아내는 것이 더욱 바람직하다. 일례로, 최빈값, 산술 평균, 그리고 중앙값의 관계를 통해서 데이터의 분포가 왼쪽으로 치우친 분포에 가까운지, 정규분포에 가까운지, 오른쪽으로 치우진 분포에 가까운지에 대한 대략적인 정보를 파악할 수 있다.
'통계' 카테고리의 다른 글
평균(Mean)과 중앙값(Median) (0) | 2023.02.26 |
---|---|
중심 극한 정리 (0) | 2023.02.26 |
중심극한정리 (0) | 2023.02.26 |
평균(Mean)과 중앙값(Median) (0) | 2023.02.26 |
평균과 중앙값 (0) | 2023.02.25 |