AIMS Study Blog

R square란? 본문

통계

R square란?

hyenzzang 2023. 2. 13. 15:10
Q.R square 의 의미는 무엇일까요?




  • 결정계수 (R square)는 회귀모델에서 독립변수가 종속변수를 얼마나 잘 설명하는지를 나타내는 성능 평가 척도 중 하나이다.
  • 결정계수는 클 수록 좋으며, 1에 가까울 수록 독립변수가 종속변수를 잘 설명할 수 있다는 뜻이다.
  • 결정계수는 아래와 같은 식으로 표현할 수 있다.

 

  • SST (Total Sum of Squares)
    • 먼저 SST는 관측값 y_i에서 관측값의 평균을 뺀 값의 제곱합이다.

  • SSE (Explained Sum of Squares)
    • SSE는 예측값 y_hat_i 에서 관측값 평균을 뺀 값의 제곱의 총합이다.

  • SSR (Residual Sum of Squares)
    • SSR은 관측값 y_i에서 예측값 y_hat_i를 뺀 값의 제곱합, 즉 잔차제곱합이다.

  • 추가적으로, R Square 는 독립변수가 많아질 수록 높아진다는 문제점이 있다.
    • 이 경우 Adjusted R-Square (조정 설명 변수)를 통해 독립변수 개수에 대한 패널티를 줌으로써 문제점을 해결할 수 있다.

 

Summary

  • 결정계수 (R square)는 회귀 모델에서 독립변수가 종속변수를 얼마나 잘 설명하는지를 나타내기 위한 성능 평가 척도 중 하나로, 값이 독립변수가 종속변수를 잘 설명한다고 볼 수 있다. R Square 는 SSE/SST 또는 1- SSR / SST 로 계산할 수 있으며, SSE는 (예측값- 관측값 평균)의 제곱합을, SSR은 (관측값-예측값)의 제곱합, SST 는 (관측값-관측값 평균)의 제곱합을 나타낸다.

 

Reference

https://velog.io/@yoonene/R-squared%EB%9E%80

'통계' 카테고리의 다른 글

R-squared 란?  (0) 2023.02.18
A/B Test  (0) 2023.02.16
P-value의 유효성  (0) 2023.02.13
p-value는 정말로 유효할까?  (0) 2023.02.12
p-value에 대해서  (0) 2023.02.11
Comments