모델 선택 (Model Selection)
모델 선택은 주어진 데이터로, 통계학적 모델을 선택하는 일입니다. 가장 간단한 경우에, 기존의 존재하는 자료가 고려됩니다. 가장 간단한 형태로, 모델 선택은 과학적인 일의 수행에 가장 기본적인 일 중에 하나입니다. 관찰된 결과들을 설명하는 이론을 결정하는 것은 그 관찰 결과를 수학적인 모델로 설명하고 예측하는 일과 관련되어 있습니다.
예를 들어서 갈릴레오가 피사의 사탑에서 구슬 떨어뜨리는 실험을 했죠? (실제로 하진 않았나요?) 하지만 경사면에서 굴리는 일은 했는데 그 굴러가는 구슬의 속도와 움직임은 그의 이론에 맞아 떨어집니다.
그 하고 많은 모델 중에서 실제의 현상과 가장 가까운 모델을 어떻게 고를까요? 일단 과학자는 평소 많이 쓰이는 모델이나 자신이 생각하기에 가깝다는 모델을 여러개 고릅니다. 모델이 골라졌으면 수학적인 분석으로 그중에 가장 나은 모델을 고릅니다. 여기서 '그중에 가장 나은' 이라는 말은 상황에 따라 달라지기도 하죠. 가장 간단한 모델이 나을 수도 있고, 가장 복잡한 모델이 현실을 잘 반영한 나은 모델일 수도 있죠. 하지만 복잡하면 복잡할 수록 실생활에서 쓰이긴 어렵겠죠. 이러한 선택은 'likelihood ratio'로 구할 수가 있습니다.
모델을 선택하는 방법에는 Statistical hypothesis testing이나 Scientific method 등이 포함됩니다.
이 모델 선택의 구체적인 분류로는 여러가지가 있지만, 일단 저희는 Bayes factor와 Akaike information criterion, 그리고 Bayesian information criterion 등을 좀더 자세히 알아볼려고 합니다.
와나 위키피디아보고 옮긴건데 뭔 말인지 저도 전혀 모르겠네요 ㅡㅡ;;;
'Statistics and Probability' 카테고리의 다른 글
Metropolis-Hastings algorithm (0) | 2012.12.07 |
---|---|
Bayes Factor (베이즈요인) (0) | 2012.08.03 |
지수분포 (Exponential distribution) (1) | 2012.07.20 |
균등 분포 (Uniform distribution) (0) | 2012.07.20 |
이항분포 (binomial Distribution) (1) | 2012.07.14 |