Open main menu

Opengenome.net β

BLAST

현재 생물정보학(bioinformatics) 연구에서 가장 많이 사용되고 있는 방법은 BLAST
(Basic Local Alignment Search Tool)이다. 잘 모르고 있는 핵산(DNA 또는 RNA) 서열이나 단백질 서열이 
주어지면, 먼저 분석하고자 하는 서열과 관계되는 서열들을 서열 데이터베이스(sequence database)로부터 
찾아낸다. 그 다음에 데이터베이스에서 찾아진 서열들로부터 분석하고자 하는 서열의 성질들을 유추해낸다. 서열
데이터베이스 검색에서 가장 대중적으로 사용되고 있는 방법이 BLAST 이다.
BLAST 를 사용하는 방법에는 두 가지가 있다. 첫 번째는 미국 NCBI 사이트(
http://www.ncbi.nlm.nih.gov/blast/)에서 
웹을 통해서 BLAST 검색을 하는 것이다. 하지만 분석하고자 하는 서열들의 수가 아주 많을 때는 BLAST 를 
개인(또는 연구실) 컴퓨터에 설치하여 검색하는 것이 훨씬 효율적이다. 가장 최근의 BLAST실행 파일들(executables)을 
NCBI 사이트(
ftp://ftp.ncbi.nlm.nih.gov/blast/executables/)에서 쉽게 얻을 수 있다.
BLAST 를 개인(또는 연구실) 컴퓨터에서 사용하기 위해서는 서열 데이터베이스들도 NCBI 에서(
ftp://ftp.ncbi.nlm.nih.gov/blast/db/
얻어야 된다. 단백질 서열을 다루는 경우에는 “nr.tar.gz”(nr 은 non-redundant 를 의미하며 이백 만개 이상의 단백질 
서열을 포함하고 있다) 파일을 얻으면 된다. 삼차원 구조가 이미 알려진(또는 특허와 관련된) 단백질 서열만을
다루고 싶을 때는 “pdb.tar.gz” (“pataa.tar.gz”) 파일을 얻어야 한다.
 

BLAST정의

# 주요 Blast 5가지를 비교설명
-         Blastp : 단백질 단백질 비교 / 관련성이 먼 것을 찾기 위해 치환행렬 사용
-         Blastn : 염기 염기 비교 / 관련성이 멀지 않으며 아주 점수가 높은 매치에 사용
-         Blastx : 염기(번역) – 단백질 비교 / 새로운 DNA 서열 및 EST 분석에 응용
-         Tblastn : 단백질 염기(번역) 비교 / DB중 코딩 부위를 찾는데 유용함
-         Tblastx : 염기(번역) – 염기(번역) 비교 / EST분석에 유용하나 많은 계산을 요함<o:p></o:p>