PFAM

From Opengenome.net
Revision as of 23:18, 3 July 2006 by 203.235.110.7 (talk)

Pfam은 ProDom에서 진화한 것으로 개념적으로 PROSITE profile들과 연관된 HMM들의 집합이다. 
Pfam 모델들은 유사 단백질의 multiple alignment로 부터 추출된 HMM profile이다.
HMMER package로 만들어 지며, HMM의 hmmpfam 명령을 통해, 단백질 서열에서 Pfam profile의 존재유무를 검사할 수 있다.

Pfam은 두가지 형태의 profile file을 제공하는데, Pfam_ls는 완전한 도메인의 구조를 찾을 때 쓰이며, Pfam_fs는 부분적인 (불완전한) 도메인 조각을 찾을 때 쓰인다.

현재의 버전은 Pfam20으로 8296개의 모델들을 포함하고 있다.

PROSITE와는 대조적으로 Pfam entry들은 semi-automatic하게 생성되어 비교적 쉽게 update 된다.
Pfam의 초기버젼에서는 비교적 낮은 정밀도를 보여주었지만, 밝혀진 서열의 종류가 늘어남에 따라 정확도가 높아지고 있으며,
풍부한 정보를 제공하는 PfamA는 약 74%의 sequence coverage를 갖는다.