반응형

역시 Bioinformatics하면 Phylogenetic Tree를 만드는 과정을 빼놓을 수가 없겠죠?

 

그래서 여기서는 Phylogenetic Tree의 기본적인 개념과 좀더 들어간 개념들을 다룰 예정입니다.

 

1. Terminology

Phylogenetic Tree에서 기본적으로 다뤄지는 단어들은 node, branch, leaves, root 등이 있습니다.

일단 Phylogenetic Tree가 뭔가는 다들 아실테지요. Phylogenetic tree는 종과 종(species) 유전자와 유전자의 genealogical 관계를 도표로 나타낸 것 입니다.

node라 함은, tree에서 하나의 개체 혹은 유전자를 나타내고, 그 유전자와 유전자를 이어주는 선이 branch입니다. tree 관계상 가장 하위에 위치한 node를 leaf 라 하구요. 한 tree에서 가장 위로 거슬러올라간 ancestor를 root이라고 합니다.

 

2. Rooting the tree.

Tree는 크게보아서 root(뿌리)가 있는 것과 없는 것으로 나눠지는데요.

만약에 진화의 속도가 시간에 비례해서 일정하다면, distance-matrix와 maximum likelihood로써 그 tree의 root을 결정할 수가 있지만, 보통은 일정하지가 않죠. 그래서 가장 자주 이용되는 방법이 outgroup을 이용하는 방법입니다.

비교를 하고 싶은 개체들을 쫙 세워놓고선, 걔들이랑 좀 관련이 덜됐다 싶은애를 넣어서, 아 얘가 root이다라고 선언하고 tree를 만드는 방법입니다.

예를 들어서 인간, 침팬지, 원숭이, 오랑우탄 들의 관계를 알고싶어서 tree를 만든다고 하면, outgroup으로 개를 집어 넣는거죠. 그렇다면, 개가 있는 branch가 root이 되는건 당연하겠죠?

하지만 이방법은 모든 종의 관계를 나열한 universal tree of life에는 적용되지않는답니다. 모든 생물이 들어가있는데 돌멩이 이런걸 넣을순 없잖아요?

 

3. Bifurcating vs. multifurcating trees

Bifurcating tree라 함은 말그대로, tree가 branch들로 나뉠때 한곳에서 2개이하로 나뉘는 것입니다. multifurcating은 3개이상 나뉘는 tree가 되겠죠. 프로그램을 짤때 특히 tree를 이용한 프로그램을 짤 때 이 bifurcating인지 아닌지가 중요하게 여겨질때가 많습니다. 예를 들어서 bifurcating tree만 받는 프로그램에 multifurcating tree를 입력한다면 에러가 나겠죠. 저도 얼마전에 그런경험이 있네요. 그런 경우에는 간단하게 계산기의 연산자입력하는 프로그램을 조금 고쳐서 multifurcating을 bifurcating으로 만들어 주면 된답니다.

 

4. topological distance between trees

두개의 tree가 있을때 이 두개의 tree가 얼마나 다른지 혹은 가까운지 측정하고 싶을때가 있습니다. 예를 들어서 어떤 새로운 알고리즘을 테스트 한다든지, 아니면 두개의 다른 유전자들을 가지고 나온 두개의 다른 tree를 비교하는거죠.

널리 쓰이는 방법은 partition distance라고 Robinson and Foulds(1981)에 나온 방법이 있는데요. 이 방법으로 금방 계산이 가능하긴 하지만, 단점 또한 세가지 있습니다. 첫째로, 이 방법으로 특정한 비슷한 관계는 알아내지 못하는 점이랑, 두번째로, 이 방법은 branch length를 무시한다는 점, 그리고 마지막으로 multifurcating tree에서는 심각한 오류가 날 수 있다는 점입니다.

 

5. Consensus trees.

partition distance가 두개의 tree가 얼마나 다른 지를 나타낸다면, consensus tree는 여러개의 tree에서 공통점을 뽑아서 대표하는 tree입니다. 여러가지 방법이 있지만 두개만 소개하도록 하겠습니다.

 

Strict consensus tree: 이 tree는 모든 tree에서 공통적으로 나타나는 node만 나타내는 tree입니다.

Majority-rule consensus tree: 이 것은 tree들 중에서 적어도 반 이상에 존재하는 node들만 나타낸 tree입니다.

 

 

728x90
반응형
Posted by Gun들지마