Difference between revisions of "PFAM"

From Opengenome.net
Line 1: Line 1:
<font face="바탕" size="2">Pfam은 [[ProDom]]에서 진화한 것으로 개념적으로 [[PROSITE]] profile들과 연관된 [[HMM]]들의 집합이다.&nbsp;<br />Pfam 모델들은 전형적으로 완전한 단백질 도메인들에 걸쳐 있으며 HMMER package나 Web-based server로 검색될 수 있다.&nbsp;<br />현재의 버전은 Pfam20으로 8296개의 모델들을 포함하고 있다.&nbsp;<br />PROSITE profile과 유사하게 Pfam 모델들은 분명한 [[homolog]]들로부터 출발하여 점차적으로 먼 집단들의 구성원들을 포함시키면서 반복적으로 정련된다. &nbsp;r들의 information-rich descriptor들 때문에 두가지 집합들은 다른 방법으로는 드물게 발견되는 단백질 모티브의 매우 먼 예도 검출한다.&nbsp;<br /><br />PROSITE와는 대조적으로 Pfam entry들은 semi-automatic하게 생성되고, 이것은 비교적 낮은 정밀도를 보여주지만 개정과정은 보다 쉽다.&nbsp;<br />Pfam documentation은 최소한이지만 자주 상응하는 PROSITE entry에 대한 연결이 포함되어 있다.&nbsp;<br />Pfam 모델들과 PROSITE profile들은 상호전환이 이루어질 수 있고, 조합 검색이 가능하다.&nbsp;<br />[[SMART]] 데이터베이스는 신호전달에 포함된 단백질 도메인들에 초점을 맞춘 181개의 HMM들의 독립적인 집합이다. </font>
+
<font face="바탕" size="2">Pfam은 [[ProDom]]에서 진화한 것으로 개념적으로 [[PROSITE]] profile들과 연관된 [[HMM]]들의 집합이다.&nbsp;<br />Pfam 모델들은&nbsp;유사 단백질의 multiple alignment로 부터&nbsp;추출된 HMM profile이다.<br />HMMER package로 만들어 지며,&nbsp;HMM의 hmmpfam 명령을 통해,&nbsp;단백질 서열에서&nbsp;Pfam profile의 존재유무를 검사할 수 있다.<br /><br />Pfam은 두가지 형태의 profile file을 제공하는데, Pfam_ls는 완전한 도메인의 구조를 찾을 때 쓰이며, Pfam_fs는 부분적인 (불완전한) 도메인 조각을 찾을 때 쓰인다.<br /><br />현재의 버전은 Pfam20으로 8296개의 모델들을 포함하고 있다.<br /><br />PROSITE와는 대조적으로 Pfam entry들은 semi-automatic하게 생성되어 비교적 쉽게 update 된다.<br />Pfam의 초기버젼에서는 비교적 낮은 정밀도를 보여주었지만,&nbsp;밝혀진 서열의 종류가 늘어남에 따라 정확도가 높아지고 있으며,<br />풍부한 정보를 제공하는 PfamA는 약 74%의 sequence coverage를 갖는다.</font>

Revision as of 23:18, 3 July 2006

Pfam은 ProDom에서 진화한 것으로 개념적으로 PROSITE profile들과 연관된 HMM들의 집합이다. 
Pfam 모델들은 유사 단백질의 multiple alignment로 부터 추출된 HMM profile이다.
HMMER package로 만들어 지며, HMM의 hmmpfam 명령을 통해, 단백질 서열에서 Pfam profile의 존재유무를 검사할 수 있다.

Pfam은 두가지 형태의 profile file을 제공하는데, Pfam_ls는 완전한 도메인의 구조를 찾을 때 쓰이며, Pfam_fs는 부분적인 (불완전한) 도메인 조각을 찾을 때 쓰인다.

현재의 버전은 Pfam20으로 8296개의 모델들을 포함하고 있다.

PROSITE와는 대조적으로 Pfam entry들은 semi-automatic하게 생성되어 비교적 쉽게 update 된다.
Pfam의 초기버젼에서는 비교적 낮은 정밀도를 보여주었지만, 밝혀진 서열의 종류가 늘어남에 따라 정확도가 높아지고 있으며,
풍부한 정보를 제공하는 PfamA는 약 74%의 sequence coverage를 갖는다.