일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 확률변수
- 선형대수
- 상관계수
- 통계
- 공분산
- 샘플링
- Self-attention
- 평균
- 확률
- 모집단
- 통계면접
- 모평균
- 누적분포함수
- p-value
- 검정
- 고유벡터
- 리샘플링
- 데이터분석
- 데이터분석면접
- 고유값
- ViT
- 표본
- 검정력
- 신뢰구간
- 조건부확률
- Transformer
- 확률밀도함수
- 베타분포
- 확률분포
- 확률모형
- Today
- Total
AIMS Study Blog
Log 함수를 사용하는 이유 본문
로그함수는 어떤 경우에 유용하게 사용할 수 있을까?
로그 함수(Log)
로그는 지수(Exponential)의 역함수 개념으로, 기본적으로 큰 수를 쉽게 다루기 위해서 사용되는 개념이다.
언제 사용되는가?
숫자의 범위가 큰 경우
기본적으로 우리의 일상생활에서 다른 수들보다 범위가 큰 수를 가진 항목들이 존재한다. 예를 들어 가격 혹은 재산 보유액 등과 같은 항목들은 사람이 단번에 숫자를 파악하기 어려운 경우가 많다. 이런 경우에 각 값들에 Log를 취한 값을 사용하여 데이터를 파악하면, 조금 더 쉽게 파악하는 것이 가능하다.
데이터가 편향되어 있는 경우
데이터 분석을 배우다보면, 대부분 로그함수를 취하는 경우에는 왼쪽이든 오른쪽이든 데이터의 분포가 편향(Skewed)되어 있는 경우에 사용한다고 설명이 되어 있다. 하지만, 값이 상대적으로 큰 데이터들이 데이터의 분포에서 집중되어 있고, 값이 작은 샘플 수는 별로 없는 경우에는, 로그를 취했을 때, 데이터들의 편향성이 더욱 증가한다고 볼 수 있다.
따라서, 로그 함수는 대부분 작은 값을 가진 샘플들이 집중되어 있고, 몇몇 샘플들이 이상치라고 생각할 만큼 큰 값을 가지고 있는 경우에 사용하면 우리가 평소에 자주 접하는 정규 분포의 형태와 비슷해진다고 볼 수 있다.
이렇게 되는 이유는 로그 값이 동일한 정도로 커지기 위해서는 값이 큰 경우에 더 많이 증가를 해야하기 때문이다.
즉, log(x) 값이 1에서 2로 가기 위해서는 실질적으로 x가 90만큼 커져야 하지만, log(x)값이 2→ 3이 되기 위해선 x가 900만큼 커져야 한다.
독립 변수와 종속 변수가 비선형성을 띄는 경우
독립 변수가 증가할 때, 종속 변수가 지수적으로 증가하는 관계를 가지고 있는 경우에는 로그를 취하게 되면, 선형적인 관계로 해석할 수 있다. 이 점은 특히 회귀 분석을 하는 경우에, 대부분의 모델이 독립 변수와 종속 변수의 선형적 관계를 파악하기 때문에, 아주 유용하게 사용된다.
Ref.
https://velog.io/@zxxzx1515/로그-함수는-어떤-경우-유용합니까-사례를-들어-설명해주세요
'통계' 카테고리의 다른 글
Cross Validation (0) | 2023.06.08 |
---|---|
로그함수 (log) (0) | 2023.06.04 |
Bias를 통제하는 방법 (0) | 2023.05.27 |
Bias 통제 방법 (0) | 2023.05.25 |
필요한 표본의 크기를 계산하는 방법 (0) | 2023.05.19 |