Wright-Fisher Model
Wright-Fisher Model은 genetic drift의 한 모델이자 population genetic model의 가장 간단한 수학적 모델입니다.
이렇게 간단한 수학적 모델을 끌어내기 위해서 여러가지 전제조건을 달고 있는데요, 이 전제 조건들은 Hardy-Weinberg Equilibrium에 쓰여진 여러 전제조건들과 비슷합니다.
1. 겹치지 않는 세대: (non-overlapping generations) 1년 살다가 이전 세대가 씨앗을 남기고 겨울에 다 죽는 1년생 식물 처럼 이전 세대와 그다음 세대의 인구가 겹치지 않습니다
2. 무작위적인 짝짓기: (random mating) 같은 gene의 경우에 모든 세대의 계승이 무작위로 이루어 집니다.
3. 유한하고 일정한 인구: (finite and constant population) 여기서 Hardy-Weinberg Equilibrium 과 다른 점인데요. 인구의 수가 세대마다 일정하며 유한합니다.
아주 간단하게 프로세스를 정리해보겠습니다. haploid 인 10개의 개체가 하나의 인구를 이루고 있다고 가정해 봅시다. 그러면 세대(generation)마다 인구수가 동일하기 때문에 다음 세대에서도 10개의 개체가 생깁니다. 이 다음 세대의 10개의 개체는 각각 하나의 parent를 랜덤하게 가집니다. 여기서 parent-offspring 관계는 선으로 나타낼 수가 있겠죠. 그리고 offspring 은 parent 와 같은 유전정보를 가집니다. 이것을 간단하게 도식으로 나타내어 보면 다음과 같습니다.
그리고 10세대가 지나면 다음과 같은 도표가 나오겠죠.
Neutral evolution 에서는 모든 개체들이 동일한 fitness를 가집니다. 그리고 neutral Wright-Fisher Model에서는 이 동일한 fitness가 parent로 선택될 동일한 확률을 가집니다. 그러므로, 위의 예를 보았을 때에 하나의 개체는 그 다음 세대에서 parent로 선택될 10번의 기회를 가지게 되고, 이것을 확률로 바꾸면 0.1이 되겠죠.
보통의 경우에 diploid가 많으므로 2N=10 으로 표현을 합니다. (확률로 하면 p= 1/2N, n = 2N)
좀더 어렵게 수학적으로 말해보자면, 다음 세대의 각각의 개체는 binomial distribution (이항분포)를 따르고 p= 1/ 2N, n = 2N 이 됩니다. 위의 예에서는 인구수를 10으로 간단하게 나타내었지만, 인구수가 늘어나면 날 수록 n은 증가하고 확률인 p는 감소하겠죠. 그렇다면 이 이항분포는 Poisson distribution으로 나타내어 집니다.
여기서 mutation의 개념을 도입해 보겠습니다.
일단 간단하게 정리하기 위해서 지금 저희가 생각하는 mutation은 neutral mutation 즉, mutation이 개체의 fitness에 어떠한 영향도 주지 않는 것을 말합니다.
하나의 제한된 인구에서 세대를 거쳐감에 따라 mutation이 일어난다고 가정해 봅시다. 이때 mutation은 새로운 allele을 인구에 소개할 수도 있지만, 다음 세대에서 그 allele이 없어질 가능성도 있습니다. 사실 mutation으로 일어나는 새로운 allele은 활률상으로 없어질 가능성이 많겠죠.
예를 들어 보겠습니다. Diploid organism을 설명할 때에 개체수가 N이면, gene의 수는 2N이 됩니다. 또한, 하나의 세대는 t = 1, 2, ....로 나타낼 수 있고, X(t)는 한 allele A가 그 세대에서 일어나는 수를 나타낸다고 합시다. 그러면 이때 X(t)는 1에서 2N까지 나올 수가 있습니다. 그리고 p_i,j는 X(t) = I 일때 X(t+1) = j 일 확률이라고 해봅시다.
t+1 세대에서 하나의 유전자는 그전 세대 t 에서 샘플링될 수가 있고, 이 p_i,j 는 이항분포를 다음과 같이 따릅니다.
복잡해 보이나요? 기본적인 이항분포에서 p = I/2N 이라고 생각해보세요 ㅎㅎ
'Biological Science > Bioinformatics' 카테고리의 다른 글
[펌]박사 학위 또는 포닥을 Bioinformatics/Computational Biology로 해야하는 탑 N 가지 이유 (0) | 2017.06.15 |
---|---|
FPKM and read counts in RNA-Seq (0) | 2017.06.14 |
[펌]Bioinformatics 슬라이드 (0) | 2013.11.09 |
[Phylogenetic Tree]1. Basic Concepts (0) | 2012.07.06 |
Viterbi algorithm (비터비 알고리즘) (0) | 2012.05.14 |