Dayhoff Mutation Data Matrix

From Opengenome.net

Dayhoff Mutation Data Matrix

Dayhoff에 의해 개발된 mutation data matrix는 현재 일반적으로 가장 많이 사용되고 있는 scoring matrix중에 하나이다. 이는 1968년에 처음 
발표당시에 알려진 단백질 서열과 그 서열들에서 유추된 ancestral 서열들로 부터 얻은 400개의 accepted point mutation을 이용하여 
mutation data matrix를 만들어 사용하였다.
이후 여러 개체들의 sequence가 밝혀짐에 따라 MDM은 계속 확장되어갔고 1980년에 71개의 연관된 group들로 붙어 얻은 1600개의 
accepted point mutation들을 근거로 MDM이 제작되었다.
단백질 서열의 mutation에 관한 Dayhoff model은 단백질 치환에 관한 Markovian model을 근거로 하고있다. Markovian model은 한 단백질내에서 
어떤 특정 위치의 mutation은 다른 위치의 mutation과 무관하다는것을 전제로 하는 것이다.
MDM이 처음 발표될 당시에는 실제 두개 이상의 nucleotide가 바뀌어야 amino acid한개가 바뀌는 amono acid의 치환 정도는 한 개의 
nucleotide가 바뀔 때 한 개의 amino acid가 바뀐다는 개념에서 유추된 amino acid의 치환 정도보다 훨씬 크다는것이 밝혀졌다. 이것은 단순한 
Markovian model에서 제시한 nucleotide에서 치환에관한 모델과는 상반되는 것이다. Dayhoff의 protein matrix는 DNA level에서 point mutation을 
포함하는 genetic mechnism이 전혀 고려되지 않았다는것을 의미한다.
MDM의 또다른 단점중에 하나는 Protein의 각 site에서 mutation이 일어날 확률이 일정하지 않다는 것이다. 현대 분자 생물학에서 단백질내에서 
각 site에 따른 mutation이 일어날 확률이 다르게 나타나는데 dayhoff는 동일한 확률이 나타나는것으로 하였기때문에 dayhoff model은 
한계점을 가지게 된다.