프리퀀티스트 & 베이지안
베이지안과 프리퀀티스트의 차이는 무엇일까요?
프리퀀티스트
프리퀀티스트(Frequentist)는 확률을 빈도로써 정의하는 전통적인 확률론을 의미한다. 우리가 실험을 했을 때 우리가 모르는 확률 값에 의해서 결과가 나온다고 여겨지게 되는 것이다. 참된 확률 값은 정해져 있고, 우리는 이것을 가설 검정을 통해서 실질적으로 맞는지에 대해서만 검증을 한다.
베이지안
베이즈(Bayes) 이론은 새로운 증거나 정보가 주어졌을 때, 새로운 정보와 사전 확률(Prior)을 이용하여 사후 확률(Posterior) 계산을 통해서 이 정보를 토대로 원래의 확률을 수정한다. 일상생활에서 확률을 구하는 경우에는 명확한 확률 값을 계산할 수 있는 경우보다, 정보가 불완전하거나, 모호한 경우가 많다. 베이지안은 이런 부분을 고려하여, 새로운 정보를 수집하여 사전 확률에서 사후 확률로 확률이 업데이트 되는 것을 계산해준다.
둘의 차이
프리퀀티스트는 어떤 사건이 일어날 확률이 특정 값으로 정해져 있다고 가정을 하고 확률을 계산하는 방법이라고 볼 수 있다.베이지안의 경우에는, 특정 사건에 대한 참된 확률값은 존재하지 않지만, 특정 사건에 대한 확률 분포가 존재한다고 가정하여, 데이터가 불완전한 환경 속에서 정보가 조금씩 주어질 때마다 이것을 업데이트해 나간다고 생각을 하면 된다.
현대에 들어서, 데이터의 양과 다양성이 증가함에 따라서 데이터로부터 직접적으로 확률을 추정하기 어려운 경우가 많아진다. 이에 따라 베이지안 방법이 많이 사용되고 있다. 또한, 베이지안 방식은 사전 지식을 반영할 수 있어, 데이터가 부족한 환경에서도 유용하게 사용될 수 있다. Machine Learning modeling에도 많이 사용되는 기법 중 하나이다.
하지만, 프리퀀티스트 역시도 통계학에서 여전히 중요한 역할을 하고 있다. 베이지안의 단점이 계산량이 상대적으로 많다는 것인데, 대규모 데이터를 사용하거나, 복잡한 모델링을 하는 경우에는 베이지안을 쓰기 부적합한 상황이 생기기도 한다.
따라서 문제의 특성과 상황에 따라 두 방법 중 어떤 방법이 더욱 적절한지에 대해서는 사용자가 판단하여야 한다.
Ref.