Difference between revisions of "BLAST"
Line 1: | Line 1: | ||
− | <font size="2">현재 [[생물정보학]]([[bioinformatics]]) 연구에서 가장 많이 사용되고 있는 <br />방법은 BLAST(Basic Local Alignment Search Tool)이다. 잘 모르고 <br />있는 [[핵산]]([[DNA]] 또는 [[RNA]]) 서열이나 [[단백질]] 서열이 주어지면, 먼저 <br />분석하고자 하는 서열과 관계되는 서열들을 서열 [[데이터베이스]](sequence <br />[[database]])로부터 찾아낸다. 그 다음에 데이터베이스에서 찾아진 <br />서열들로부터 분석하고자 하는 서열의 성질들을 유추해낸다. 서열 <br />데이터베이스 검색에서 가장 대중적으로 사용되고 있는 방법이 BLAST 이다. <br />BLAST 를 사용하는 방법에는 두 가지가 있다. 첫 번째는 미국 <br />[[NCBI]] 사이트(</font><a href="http://www.ncbi.nlm.nih.gov/blast/"><font size="2">http://www.ncbi.nlm.nih.gov/blast/</font></a><font size="2">)에서 웹을 통해서 BLAST <br />검색을 하는 것이다. 하지만 분석하고자 하는 서열들의 수가 아주 많을 때는 <br />BLAST 를 개인(또는 연구실) 컴퓨터에 설치하여 검색하는 것이 훨씬 <br />효율적이다. 가장 최근의 BLAST실행 파일들(executables)을 NCBI 사이트<br />(</font><a href="ftp://ftp.ncbi.nlm.nih.gov/blast/executables/"><font size="2">ftp://ftp.ncbi.nlm.nih.gov/blast/executables/</font></a><font size="2">)에서 쉽게 얻을 수 있다. <br />BLAST 를 개인(또는 연구실) 컴퓨터에서 사용하기 위해서는 서열 <br />데이터베이스들도 NCBI 에서(</font><a href="ftp://ftp.ncbi.nlm.nih.gov/blast/db/"><font size="2">ftp://ftp.ncbi.nlm.nih.gov/blast/db/</font></a><font size="2">) 얻어야 <br />된다. 단백질 서열을 다루는 경우에는 “nr.tar.gz”(nr 은 non-redundant 를<br />의미하며 이백 만개 이상의 단백질 서열을 포함하고 있다) 파일을 얻으면 <br />된다. 삼차원 구조가 이미 알려진(또는 특허와 관련된) 단백질 서열만을 <br />다루고 싶을 때는 “pdb.tar.gz” (“pataa.tar.gz”) 파일을 얻어야 한다.</font> <br /><br /><a href="javascript:void(window.open('http://bric.postech.ac.kr/info/review/12.html','','resizable=yes,location=yes,menubar=yes,scrollbars=yes,status=yes,toolbar=yes,fullscreen=no,dependent=no'))"><font size="4"><strong>BLAST정의 (By. Bric)</strong></font></a> | + | <font size="2">현재 [[생물정보학]]([[bioinformatics]]) 연구에서 가장 많이 사용되고 있는 <br />방법은 BLAST(Basic Local Alignment Search Tool)이다. 잘 모르고 <br />있는 [[핵산]]([[DNA]] 또는 [[RNA]]) 서열이나 [[단백질]] 서열이 주어지면, 먼저 <br />분석하고자 하는 서열과 관계되는 서열들을 서열 [[데이터베이스]](sequence <br />[[database]])로부터 찾아낸다. 그 다음에 데이터베이스에서 찾아진 <br />서열들로부터 분석하고자 하는 서열의 성질들을 유추해낸다. 서열 <br />데이터베이스 검색에서 가장 대중적으로 사용되고 있는 방법이 BLAST 이다. <br />BLAST 를 사용하는 방법에는 두 가지가 있다. 첫 번째는 미국 <br />[[NCBI]] 사이트(</font><a href="http://www.ncbi.nlm.nih.gov/blast/"><font size="2">http://www.ncbi.nlm.nih.gov/blast/</font></a><font size="2">)에서 웹을 통해서 BLAST <br />검색을 하는 것이다. 하지만 분석하고자 하는 서열들의 수가 아주 많을 때는 <br />BLAST 를 개인(또는 연구실) 컴퓨터에 설치하여 검색하는 것이 훨씬 <br />효율적이다. 가장 최근의 BLAST실행 파일들(executables)을 NCBI 사이트<br />(</font><a href="ftp://ftp.ncbi.nlm.nih.gov/blast/executables/"><font size="2">ftp://ftp.ncbi.nlm.nih.gov/blast/executables/</font></a><font size="2">)에서 쉽게 얻을 수 있다. <br />BLAST 를 개인(또는 연구실) 컴퓨터에서 사용하기 위해서는 서열 <br />데이터베이스들도 NCBI 에서(</font><a href="ftp://ftp.ncbi.nlm.nih.gov/blast/db/"><font size="2">ftp://ftp.ncbi.nlm.nih.gov/blast/db/</font></a><font size="2">) 얻어야 <br />된다. 단백질 서열을 다루는 경우에는 “nr.tar.gz”(nr 은 non-redundant 를<br />의미하며 이백 만개 이상의 단백질 서열을 포함하고 있다) 파일을 얻으면 <br />된다. 삼차원 구조가 이미 알려진(또는 특허와 관련된) 단백질 서열만을 <br />다루고 싶을 때는 “pdb.tar.gz” (“pataa.tar.gz”) 파일을 얻어야 한다.</font> <br /><br /><a href="javascript:void(window.open('http://bric.postech.ac.kr/info/review/12.html','','resizable=yes,location=yes,menubar=yes,scrollbars=yes,status=yes,toolbar=yes,fullscreen=no,dependent=no'))"><font size="4"><strong>BLAST정의 (By. Bric)</strong></font></a><br /><br /> |
+ | <p class="MsoNormal" style="MARGIN: 0cm 0cm 0pt"><span style="FONT-FAMILY: 굴림"><font size="3"><font color="#99cc00"><strong># 주요<span lang="EN-US"> Blast 5</span>가지를 비교설명<br /></strong></font></font></span><span lang="EN-US" style="mso-bidi-font-family: 바탕; mso-hansi-font-family: 바탕"><span style="mso-list: Ignore"><font face="바탕" size="2">-</font><span style="FONT: 7pt "Times New Roman""> </span></span></span><font size="2"><span lang="EN-US" style="FONT-FAMILY: 굴림">Blastp : </span><span style="FONT-FAMILY: 굴림">단백질 <span lang="EN-US">– </span>단백질 비교<span lang="EN-US"> / </span>관련성이 먼 것을 찾기 위해 치환행렬 사용<br /></span></font><span lang="EN-US" style="mso-bidi-font-family: 바탕; mso-hansi-font-family: 바탕"><span style="mso-list: Ignore"><font face="바탕" size="2">-</font><span style="FONT: 7pt "Times New Roman""> </span></span></span><font size="2"><span lang="EN-US" style="FONT-FAMILY: 굴림">Blastn : </span><span style="FONT-FAMILY: 굴림">염기 <span lang="EN-US">– </span>염기 비교<span lang="EN-US"> / </span>관련성이 멀지 않으며 아주 점수가 높은 매치에 사용<br /></span></font><span lang="EN-US" style="mso-bidi-font-family: 바탕; mso-hansi-font-family: 바탕"><span style="mso-list: Ignore"><font face="바탕" size="2">-</font><span style="FONT: 7pt "Times New Roman""> </span></span></span><font size="2"><span lang="EN-US" style="FONT-FAMILY: 굴림">Blastx : </span><span style="FONT-FAMILY: 굴림">염기<span lang="EN-US">(</span>번역<span lang="EN-US">) – </span>단백질 비교<span lang="EN-US"> / </span>새로운<span lang="EN-US"> DNA </span>서열 및<span lang="EN-US"> EST </span>분석에 응용<br /></span></font><span lang="EN-US" style="mso-bidi-font-family: 바탕; mso-hansi-font-family: 바탕"><span style="mso-list: Ignore"><font face="바탕" size="2">-</font><span style="FONT: 7pt "Times New Roman""> </span></span></span><font size="2"><span lang="EN-US" style="FONT-FAMILY: 굴림">Tblastn : </span><span style="FONT-FAMILY: 굴림">단백질 <span lang="EN-US">– </span>염기<span lang="EN-US">(</span>번역<span lang="EN-US">) </span>비교<span lang="EN-US"> / DB</span>중 코딩 부위를 찾는데 유용함<br /></span></font><span lang="EN-US" style="mso-bidi-font-family: 바탕; mso-hansi-font-family: 바탕"><span style="mso-list: Ignore"><font face="바탕" size="2">-</font><span style="FONT: 7pt "Times New Roman""> </span></span></span><font size="2"><span lang="EN-US" style="FONT-FAMILY: 굴림">Tblastx : </span><span style="FONT-FAMILY: 굴림">염기<span lang="EN-US">(</span>번역<span lang="EN-US">) – </span>염기<span lang="EN-US">(</span>번역<span lang="EN-US">) </span>비교<span lang="EN-US"> / EST</span>분석에 유용하나 많은 계산을 요함<span lang="EN-US"><o:p></o:p></span></span></font></p> |
Revision as of 13:33, 28 June 2006
현재 생물정보학(bioinformatics) 연구에서 가장 많이 사용되고 있는
방법은 BLAST(Basic Local Alignment Search Tool)이다. 잘 모르고
있는 핵산(DNA 또는 RNA) 서열이나 단백질 서열이 주어지면, 먼저
분석하고자 하는 서열과 관계되는 서열들을 서열 데이터베이스(sequence
database)로부터 찾아낸다. 그 다음에 데이터베이스에서 찾아진
서열들로부터 분석하고자 하는 서열의 성질들을 유추해낸다. 서열
데이터베이스 검색에서 가장 대중적으로 사용되고 있는 방법이 BLAST 이다.
BLAST 를 사용하는 방법에는 두 가지가 있다. 첫 번째는 미국
NCBI 사이트(http://www.ncbi.nlm.nih.gov/blast/)에서 웹을 통해서 BLAST
검색을 하는 것이다. 하지만 분석하고자 하는 서열들의 수가 아주 많을 때는
BLAST 를 개인(또는 연구실) 컴퓨터에 설치하여 검색하는 것이 훨씬
효율적이다. 가장 최근의 BLAST실행 파일들(executables)을 NCBI 사이트
(ftp://ftp.ncbi.nlm.nih.gov/blast/executables/)에서 쉽게 얻을 수 있다.
BLAST 를 개인(또는 연구실) 컴퓨터에서 사용하기 위해서는 서열
데이터베이스들도 NCBI 에서(ftp://ftp.ncbi.nlm.nih.gov/blast/db/) 얻어야
된다. 단백질 서열을 다루는 경우에는 “nr.tar.gz”(nr 은 non-redundant 를
의미하며 이백 만개 이상의 단백질 서열을 포함하고 있다) 파일을 얻으면
된다. 삼차원 구조가 이미 알려진(또는 특허와 관련된) 단백질 서열만을
다루고 싶을 때는 “pdb.tar.gz” (“pataa.tar.gz”) 파일을 얻어야 한다.
BLAST정의 (By. Bric)
# 주요 Blast 5가지를 비교설명
- Blastp : 단백질 – 단백질 비교 / 관련성이 먼 것을 찾기 위해 치환행렬 사용
- Blastn : 염기 – 염기 비교 / 관련성이 멀지 않으며 아주 점수가 높은 매치에 사용
- Blastx : 염기(번역) – 단백질 비교 / 새로운 DNA 서열 및 EST 분석에 응용
- Tblastn : 단백질 – 염기(번역) 비교 / DB중 코딩 부위를 찾는데 유용함
- Tblastx : 염기(번역) – 염기(번역) 비교 / EST분석에 유용하나 많은 계산을 요함<o:p></o:p>