AIMS Study Blog

Log 함수를 사용하는 이유 본문

통계

Log 함수를 사용하는 이유

hannn 2023. 6. 4. 10:00
로그함수는 어떤 경우에 유용하게 사용할 수 있을까?

로그 함수(Log)

 

로그는 지수(Exponential)의 역함수 개념으로, 기본적으로 큰 수를 쉽게 다루기 위해서 사용되는 개념이다. 

 

 

언제 사용되는가?

 

숫자의 범위가 큰 경우 

기본적으로 우리의 일상생활에서 다른 수들보다 범위가 큰 수를 가진 항목들이 존재한다. 예를 들어 가격 혹은 재산 보유액 등과 같은 항목들은 사람이 단번에 숫자를 파악하기 어려운 경우가 많다. 이런 경우에 각 값들에 Log를 취한 값을 사용하여 데이터를 파악하면, 조금 더 쉽게 파악하는 것이 가능하다. 

 

 

 

데이터가 편향되어 있는 경우 

 

데이터 분석을 배우다보면, 대부분 로그함수를 취하는 경우에는 왼쪽이든 오른쪽이든 데이터의 분포가 편향(Skewed)되어 있는 경우에 사용한다고 설명이 되어 있다. 하지만, 값이 상대적으로 큰 데이터들이 데이터의 분포에서 집중되어 있고, 값이 작은 샘플 수는 별로 없는 경우에는, 로그를 취했을 때, 데이터들의 편향성이 더욱 증가한다고 볼 수 있다. 

 

따라서, 로그 함수는 대부분 작은 값을 가진 샘플들이 집중되어 있고, 몇몇 샘플들이 이상치라고 생각할 만큼 큰 값을 가지고 있는 경우에 사용하면 우리가 평소에 자주 접하는 정규 분포의 형태와 비슷해진다고 볼 수 있다. 

 

이렇게 되는 이유는 로그 값이 동일한 정도로 커지기 위해서는 값이 큰 경우에 더 많이 증가를 해야하기 때문이다. 

즉, log(x) 값이 1에서 2로 가기 위해서는 실질적으로 x가 90만큼 커져야 하지만, log(x)값이 2→ 3이 되기 위해선 x가 900만큼 커져야 한다. 

 

 

 

 

독립 변수와 종속 변수가 비선형성을 띄는 경우

 

독립 변수가 증가할 때, 종속 변수가 지수적으로 증가하는 관계를 가지고 있는 경우에는 로그를 취하게 되면, 선형적인 관계로 해석할 수 있다. 이 점은 특히 회귀 분석을 하는 경우에, 대부분의 모델이 독립 변수와 종속 변수의 선형적 관계를 파악하기 때문에, 아주 유용하게 사용된다. 

 

 

 

Ref.

https://dangdo.tistory.com/44

https://velog.io/@zxxzx1515/로그-함수는-어떤-경우-유용합니까-사례를-들어-설명해주세요

'통계' 카테고리의 다른 글

Cross Validation  (0) 2023.06.08
로그함수 (log)  (0) 2023.06.04
Bias를 통제하는 방법  (0) 2023.05.27
Bias 통제 방법  (0) 2023.05.25
필요한 표본의 크기를 계산하는 방법  (0) 2023.05.19
Comments