AIMS Study Blog

누적 분포 함수와 확률 밀도 함수 본문

통계

누적 분포 함수와 확률 밀도 함수

호Tuck 2023. 1. 22. 21:47

 

누적분포함수(Cumulative Distribution Function; cdf)란?

 

 

 

주어진 확률변수가 특정 값보다 작거나 같은 확률을 나타내는 함수입니다. 

확률변수 x가 -∞부터 누적되어 특정 Input값까지 누적된 확률로 정의할 수 있습니다.

누적분포함수는 다음과 같은 특징을 가집니다.

 

Fx(x) : R -> R에서 F가 누적분포함수를 뜻한다면,4가지 성질을 만족합니다.

 

1. (증가함수 일 경우) x <= y 라면 F(x)<=F(y)2. (우연속함수 일 경우) F(x+) = F(x)3. F(-∞) = 04. F(∞) = 1

 

 

(-8, 8) space에 정규분포함수 rv가 존재할 경우 CDF를 그려보면

위의 그림과 같이 -8로부터 정규분포의 확률이 누적되어 표시되는 것을 확인할 수 있습니다. 

 

 

확률밀도함수(Probability Density Function; pdf)란?

확률변수 x의 분포를 나타내는 함수로, 확률 자체가 누적되는 cdf와는 차이가 있습니다.

확률밀도함수 f(x) 와 구간 [a, b]에 대해서 확률 변수 X가 구간에 포함될 확률 P(a<x<b)는 

으로 표현이 가능합니다.

확률밀도함수는 다음의 두 조건을 만족해야 성립합니다.

 

- 모든 실수값 x에 대해 f(x)>=0

- 위의 적분 식 값을 -∞부터 ∞까지 했을 때 1의 값

 

 

따라서 미분과 적분과 같은 추가적인 metric도 적용가능함을 알 수 있습니다.

Comments