AIMS Study Blog

베르누이 분포 / 이항 분포 / 카테고리 분포 / 다항 분포 / 가우시안 정규 분포 / T 분포 / 카이제곱 분포 / F 분포 / 베타 분포 / 감마 분포 / 디리클레 분포 본문

통계

베르누이 분포 / 이항 분포 / 카테고리 분포 / 다항 분포 / 가우시안 정규 분포 / T 분포 / 카이제곱 분포 / F 분포 / 베타 분포 / 감마 분포 / 디리클레 분포

김랑명 2023. 1. 28. 18:57
베르누이 분포 / 이항 분포 / 카테고리 분포 / 다항 분포 / 가우시안 정규 분포 / T 분포 / 카이제곱 분포 / F 분포 / 베타 분포 / 감마 분포 / 디리클레 분포에 대해 설명해주세요. 혹시 연관된 분포가 있다면 연관 관계를 설명해주세요.

 

 

1. 베르누이 분포

시행의 결과 값이 성공과 실패 두 가지만 가지고, 각 시행의 성공 확률이 p, 실패 확률이 1-p인 실험을 베르누이 시행(Bernoulli trial)이라고 부릅니다. 그리고 이 때의 확률 변수 x는 베르누이 분포를 가진다고 하며 수식으로는 다음과 같이 표기한다.

2. 이항분포

성공확률이 p인 베르누이시행을 n번 반복시행할 때 성공횟수를 나타내는 확률변수 X의 분포를 이항분포(binomial distribution)이라고 한다. 이항분포의 확률질량함수는 다음과 같다.

이항분포의 질량함수를 시각화하면 다음 그림과 같다.

 

 

3. 카테고리 분포

정수 개의 결과값을 가지는 분포를 카테고리형 분포라고 한다. 예를 들어주사위의 경우 K=6인 카테고리 분포를 따른다고 표기할 수 있으며, 이를 수식으로 표현하면 아래와 같습니다.

아래 수식은 윗 수식을 벡터로 줄여서 표현한 것으로 , 두 수식이 의미하는 바는 같다.

확률 질량 함수는 아래처럼 표기할 수 있다.

4. 다항 분포 

카테고리형 시행을 여러번 반복하면 다항 분포가 되는데, 다항분포(Multinomial)란 여러 개의 값을 가질 수 있는 독립 확률변수들에 대한 확률분포를 가리킨다. 여러 번의 독립시행에서 각각의 값이 특정 횟수가 나타날 확률을 말한다.

어떤 시행에서 k가지의 값이 나타날 수 있고, 그 값이 나타날 확률을 각각 p1,p2,,pk라고 할 때 n번의 시행에서 i번째 값이 xi회 나타날 확률은 다음과 같다. 즉 다항분포의 확률질량함수는 아래와 같다.

5. 가우시안 정규 분포

평균을 중심으로 좌우가 대칭인 종 모양을 그리는 정규 분포이다. 가우시안 분포라고도 불리며 정규 분포의 확률 밀도 함수와 그 그래프는 아래와 같다.

6. T 분포

T 분포는 정규 분포인 모집단의 모평균을 표본 평균을 통해서 추측할 때 사용되는 분포이다. 표본 평균을 x̄라 두었을 때 확률 변수 를 정규화 하면 아래와 같은 식이 된다. 윗 변에서는 x̄를 x̄의 기대값인 μ로 빼준다. 아랫 변에서는 x̄의 표준 편차인 s(n)^1/2로 나누어 준다(표본 평균의 표준편차). 이 때의 s는 표본 표준 편차로 수식은 아래와 같다.

 

7. 카이제곱 분포

카이제곱분포는 k개의 독립적이고 표준 정규분포를 따르는 확률 변수들의 제곱의 합이 갖는 분포입니다. 카이제곱분포의 수식과 그래프는 아래와 같다.

8. F 분포

F-분포는 두 확률 변수 V1, V2가 각각 자유도가 k1, k2이고 서로 독립인 카이제곱 분포를 따른다고 할 때 형성하는 분포로 수식과 그래프는 아래와 같다.

9. 베타 분포

베타분포(beta distribution)란 두 매개변수 αβ에 대해[0,1]에서 정의되는 연속확률분포들의 가족을 가리킨다. 베타분포의 확률밀도함수는 다음과 같다.

베타분포의 확률밀도함수인 감마함수 Γ는 다음과 같이 정의된다.

10. 감마 분포

감마 함수는 팩토리얼의 개념을 함수로 일반화하여 표현한 것이다. 감마 분포는 k번째 사건이 일어날 때까지 걸리는 시간에 대한 연속 확률분포이다. 즉, 총 k번의 사건이 발생할 때까지 걸리는 시간의 확률 분포로 생각할 수 있다.

11. 디리클레 분포

디리클레분포 k차원의 실수 벡터 중 벡터의 요소가 양수이며 모든 요소를 더한 값이 1인 경우에 확률값이 정의되는 연속확률분포이다. 2이상의 자연수 k와 양의 상수 α1,,αk에 대하여 디리클레분포의 확률밀도함수는 다음과 같이 정의된다.

3차원 디리클레 분포의 모양은 다음과 같다.

왼쪽 위부터 시계방향으로  α =(6, 2, 2), (3, 7, 5), (6, 2, 6), (2, 3, 4)

 

 

Reference

 

'통계' 카테고리의 다른 글

조건부 확률이란?  (0) 2023.01.29
조건부 확률  (0) 2023.01.29
다양한 분포  (2) 2023.01.28
여러가지 분포들  (1) 2023.01.26
확률 밀도 함수와 누적 분포 함수  (0) 2023.01.22
Comments