확률 모형과 확률 변수
확률변수와 확률모형은 무엇인가요?
확률변수는 random variable, 확률모형은 probabilistic model이다.
1. 확률 변수
확률변수는 일반적으로 X로 표기하며 확률로 표기하기 위한 event를 정의하는 것이다.
이 때 확률변수를 다양하게 정의할 수 있으므로 변수라는 용어를 사용한다.
sample space S ={1, 2, 3, 4, 5, 6} 일 때 확률변수 X = {1, 2} / {1, 3, 5} / {4, 6} 등
확률변수는 보통 수학에서 다루는 미지수 X로 생각하면 되고, 확률이 정의된 Sample space 내에서 이러한 확률변수를 0과 1 사이로 mapping하는 함수를 확률 함수(확률 분포 함수)라고 한다.
이산 확률 변수
- 확률변수가 취할 수 있는 값이 이산적, 즉 정수인 경우 이산확률변수
- 이 때 확률함수는 확률 질량 함수라고 한다.
연속 확률 변수
- 확률변수가 취할 수 있는 값이 연속적, 즉 실수인 경우 연속확률변수
- 이 때 확률함수는 확률 밀도 함수라고 한다.
2. 확률모형
확률 모형이란 수집 및 관측된 데이터의 발생 확률 (또는 분포)을 잘 근사하는 모형으로 일반적으로 아래 수식으로 표기된다. 확률 모형 (Probability Model), 통계 모형 (Statistical Model), 확률 분포 (Probability Distribution) 모두 같은 뜻으로 사용된다.
이때, 는 확률 모형을 정의하는 데 중요한 역할을 하는 값으로 모수(parameter) 또는 요약 통계량(Descriptive measure)라고 부른다. 일반적으로 모수 추정의 목적은 데이터의 실제 확률 분포를 최대한 잘 근사하는 수학적 모형을 찾는 것이다. 이처럼 근사화한 모델을 사용하는 이유는 실제 데이터 확률 분포 또는 실제 파라미터를 정확하게 할 수 없기 때문에 추정치를 찾는다.
확률 모형을 세우는 이유는 불확실/확률적 상황에 대해 수학적 모형을 세우고, 정량적으로 예측을 해보며 예측 기대와의 일치 정도를 합리적으로 평가하기 위함이다.
Referance