한국인 HapMap 데이터베이스 개발
목표: 한국인 HapMap 과제에서 생산된 SNP 및 Haplotype 데이터를 D/B로 구축하고 LD 분석방법을 개발하며, 통합적인 HapMap 데이터마이닝 시스템을 구축함
연구내용:
○ 국내 SNP 및 Haplotype 데이터의 D/B 구축
-
국내 SNP 및 Haplotype 데이터의 수집 기능 강화
-
구축 된 D/B의 검색 기능 개선
○ LD 및 기타 분석 프로그램 개발
-
LD block을 이용한 Population comparison system 개발
-
자동화된 SNP 및 haplotype 분석 프로그램 개발
○ 각종 유전자정보와 연계된 HapMap 검색 시스템 구축
-
유전자 별 HapMap 검색 시스템 구축
-
ENCODE 부위별 HapMap 검색 시스템 구축
○ 통합적인 포탈 시스템 구축
-
dbSNP 및 International HapMap 데이터의 포탈 기능 구축
-
자동화된 통합적인 데이터의 포탈 기능 구축
○ 통합적인 HapMap 데이터마이닝 시스템 구축
-
인종 간 HapMap 비교 검색 시스템 구축
-
유전자 및 부위별 HapMap 검색 시스템의 기능 강화
기대효과
과제를 통해 구축된 한국인 HapMap 데이터베이스와 검색시스템은 국내 연구자들이 질병연관 연구를 수행할 때 데이터마이닝 시스템으로 활용되어 암, 당뇨병 등과 같은 복합질병의 유전자를 찾는데 중요한 정보를 제공하게 될 것이며, 궁극적으로는 개인별 맞춤약물개발과 같은 신약개발의 중요한 자료로 이용될 수 있을 것임
주요 제공 기능
- Haploview: Haplotype reconstruction, LD Block partition, Tagging SNP prediction, Disease Association
- PHASE: Recombination rate calculation
- TCS: Haplotype Maximum Parsimony Tree construction
엔코드 영역
bSNP에 등록된 모든 SNP와 추가적으로 resequencing을 통해 새로 발굴한 모든 SNP에 대해 보다 조밀한 간격으로 genotyping 실험을 진행하였다. 이 연구에서는 10개의 Hapmap ENCODE 중에서 ENm010 영역을 분석에 사용하였다.
Region Name |
Chromosome band |
Genomic interval |
Genotyping group |
ENr112 |
2p16.3 |
Chr2:51633239..52133238 |
McGill-GQIC, Perlegen |
ENr131 |
2q37.1 |
Chr2:234778639..235278638 |
McGill-GQIC, Perlegen |
ENr113 |
4q26 |
Chr4:118705475..119205474 |
Broad, Perlegen |
ENm010 |
7p15.2 |
Chr7:26699793..27199792 |
UCSF-WU, Perlegen |
ENm013 |
7q21.13 |
Chr7:89395718..89895717 |
Broad, Perlegen |
ENm014 |
7q31.33 |
Chr7:126135436..126632577 |
Broad, Perlegen |
ENr321 |
8q24.11 |
Chr8:118769628..119269627 |
Illumina, Perlegen |
ENr232 |
9q34.11 |
Chr9:127061347..127561346 |
Illumina, Perlegen |
ENr123 |
12q12 |
Chr12:38626477..39126476 |
BCM, Perlegen |
ENr213 |
18q12.1 |
Chr18:23717221..24217220 |
Illumina, Perlegen |