AIMS Study Blog

확률 밀도 함수와 누적 분포 함수 본문

통계

확률 밀도 함수와 누적 분포 함수

정저엉지 2023. 1. 22. 21:50
Q. 누적 분포 함수와 확률 밀도 함수는 무엇일까요? 수식과 함께 표현해주세요

 

이 글은 이전에 다뤘던 '확률 변수'에 이어지는 내용이다. 그러므로 관련 게시글을 먼저 보고 넘어오면 좀 더 도움이 될 것이다 φ(._.)

확률 변수의 분류

특정 사건에 대한 확률을 나타내는 변수인 확률 변수(random variable)는 그 값에 따라 2가지로 나뉜다.

  • 이산 확률 변수(Discrete random variable): 확률 변수의 값이 정수와 같이 연속이 아닌 이산적인 경우
  • 연속 확률 변수(Continuous random variable): 확률 변수의 값이 실수와 같이 연속적인 경우

확률 변수의 값에 따라 확률 변수의 분포를 나타내는 함수(확률분포함수)도 그 명칭과 성질이 다르게 정의된다.

  • 이산확률변수 - 확률 질량 함수(Probability Mass Function, PMF)
  • 연속확률변수 - 확률 밀도 함수(Probability Density Function, PDF)

본 게시글에서는 연속확률변수의 확률 분포 함수인 확률 밀도 함수와 누적 분포 함수에 대해 다루었다.

 

확률 밀도 함수란?

확률 밀도 함수(Probability Density Function, PDF)는 위에서 말했듯이 연속 확률 변수의 분포, 즉 연속 확률 분포를 나타내는 확률 분포 함수의 한 종류이다.

 

연속 확률 변수 X가 [a, b]의 값을 가질 때의 확률은 확률 밀도 함수 $f(x)$를 사용하여 다음과 같이 나타낼 수 있다.

$$P(a \leq X \leq b) = \int_a^bf(x)dx$$

즉, 특정 구간에서의 확률은 확률 밀도 함수를 적분하여 구할 수 있다.

 

연속 확률 변수와 확률 밀도 함수의 대표적인 성질은 다음과 같다.

 

  1. $P(X=x) = 0$ (연속 확률 변수는 무한하기 때문에 임의의 실수 x에 대한 확률이 정의되지 않음)
  2. $\int_{-\infty}^\infty f(x)dx = 1$
  3. $0 \leq f(x) \leq 1$

누적 분포 함수란?

누적 분포 함수(Cumulative Distribution Function, CDF)는 확률 변수 X가 특정 값 a보다 작거나 같을 확률을 나타내는 함수로, 다음의 수식으로 표현된다.

$$F(a) = P(X \leq a) = \int_{-\infty}^af(x)dx$$

 

누적 분포 함수의 특징은 다음과 같다.

 

  1. $F({-\infty}) = 0$
  2. $F(\infty) = 1$
  3. $F(x) \leq F(y)$ if  $x < y$

확률 밀도 함수와 누적 분포 함수의 관계

누적 분포 함수의 표현에서 알 수 있듯이, 확률 밀도 함수와 누적 분포 함수는 미분-적분 관계이다.

$$F(x) = \int_{-\infty}^xf(x)dx$$

$$f(x) = \frac{d}{dx}F(x)$$

 

 

요약하면,

확률 밀도 함수는 연속 확률 변수의 분포를 나타내는 함수를, 누적 분포 함수는 확률 변수가 특정 값보다 작거나 같을 확률을 나타내는 함수를 의미한다.

확률 밀도 함수를 적분하면 누적 분포 함수가 되고 누적 분포 함수를 미분하면 확률 밀도 함수가 된다.

 

 

 

References

- https://datascienceschool.net/02%20mathematics/06.04%20%ED%99%95%EB%A5%A0%EB%B6%84%ED%8F%AC%ED%95%A8%EC%88%98.html

- https://variety82p.tistory.com/entry/누적분포-함수와-확률밀도-함수

- https://datalabbit.tistory.com/40

Comments