통계

확률 변수와 확률 모형

호우루기 2023. 1. 21. 16:53

확률 변수와 확률 모형에 대해 다뤄보겠습니다. 

위키피디아에는 확률의 뜻이 다음과 같이 나와있습니다.

 

"확률(確率, probability)은 어떤 일이 일어날 가능성을 측량하는 단위로 비율이나 빈도로 나타낸다." 

 

어떤 일이 일어날 가능성이 확률이라면 "어떤 일"을 확률 변수라 생각하면 됩니다. 그리고 그 확률 변수에 해당하는 확률로 나타내는 함수가 확률 분포 함수입니다. 물론 확률 변수가 이산형인지, 연속형인지에 따라 확률 질량 함수, 확률 밀도 함수로 다른 종류의 함수이긴 합니다만, 핵심은 "어떤 일"에 해당하는 확률 변수에 대해 각각의 확률 변수를 확률로 사상시키는 함수를 확률 함수라고 합니다. 

 

그렇다면 확률 모형은 무엇일까요? 쉽게 말해 가지고 있는 데이터가 어떤 분포를 가지고 있는지, 확률 분포 함수에 근사한 분포 함수를 추정하는 수학적 모형입니다. 가지고 있는 데이터로 실제 현실 세계의 분포를 추정하는 수식을 모델링하는 것입니다. 

실제 현실 세계의 분포를 결정하는 어떤 인자가 존재합니다. 예를 들어 가우시안 분포라면 평균과 표준편차라는 인자가 존재하는 것처럼, 분포의 모수를 알아야 확률 분포 함수를 알게 됩니다. 그러므로 우리가 확률 모형을 만든다는 것은 모수를 추정하여 실제 확률 분포 함수에 근사한 모형을 만들어낸다는 의미를 갖습니다.

 

면접에서 확률 변수와 확률 모형에 대해 설명하라고 한다면,

"확률 변수란 확률 분포 함수에서 사건에 해당하는 것이며, 확률 변수에 해당하는 확률로 맵핑하는 함수가 확률 분포 함수인데, 이 확률 분포 함수를 추정하는 모형이 확률 모형입니다." 라 답한다면 될 것 같습니다.