Notice
Recent Posts
Recent Comments
Link
AIMS Study Blog
R square란? 본문
Q.R square 의 의미는 무엇일까요?
- 결정계수 (R square)는 회귀모델에서 독립변수가 종속변수를 얼마나 잘 설명하는지를 나타내는 성능 평가 척도 중 하나이다.
- 결정계수는 클 수록 좋으며, 1에 가까울 수록 독립변수가 종속변수를 잘 설명할 수 있다는 뜻이다.
- 결정계수는 아래와 같은 식으로 표현할 수 있다.
- SST (Total Sum of Squares)
-
- 먼저 SST는 관측값 y_i에서 관측값의 평균을 뺀 값의 제곱합이다.
- SSE (Explained Sum of Squares)
- SSE는 예측값 y_hat_i 에서 관측값 평균을 뺀 값의 제곱의 총합이다.
- SSR (Residual Sum of Squares)
- SSR은 관측값 y_i에서 예측값 y_hat_i를 뺀 값의 제곱합, 즉 잔차제곱합이다.
- 추가적으로, R Square 는 독립변수가 많아질 수록 높아진다는 문제점이 있다.
- 이 경우 Adjusted R-Square (조정 설명 변수)를 통해 독립변수 개수에 대한 패널티를 줌으로써 문제점을 해결할 수 있다.
Summary
- 결정계수 (R square)는 회귀 모델에서 독립변수가 종속변수를 얼마나 잘 설명하는지를 나타내기 위한 성능 평가 척도 중 하나로, 값이 독립변수가 종속변수를 잘 설명한다고 볼 수 있다. R Square 는 SSE/SST 또는 1- SSR / SST 로 계산할 수 있으며, SSE는 (예측값- 관측값 평균)의 제곱합을, SSR은 (관측값-예측값)의 제곱합, SST 는 (관측값-관측값 평균)의 제곱합을 나타낸다.
Reference
'통계' 카테고리의 다른 글
R-squared 란? (0) | 2023.02.18 |
---|---|
A/B Test (0) | 2023.02.16 |
P-value의 유효성 (0) | 2023.02.13 |
p-value는 정말로 유효할까? (0) | 2023.02.12 |
p-value에 대해서 (0) | 2023.02.11 |
Comments