Functional Genomics

From Opengenome.net
Revision as of 10:08, 28 June 2006 by Ksjung (talk | contribs)

Functional genomics

        게놈 프로젝트에 의해 제공된 DNA 서열자료는 기능 게놈학 (functional genomics)라는 새로운 분야를 낳았다. 이 접근은 특정한 유전자가 속하는 경로들을 이해시켜 건강과 질환에서 그들의 역할에 해답을 제공할 것이다.

         포유동물의 게놈에는 7만개 내지 십만개의 유전자들이 있는 것으로 추정되고 있다. 이러한 유전학적 '청사진 (blueprint)'을 살아있는 생물체에 적용하기 위해서는 이러한 유전자 각각이 특정한 시간적 공간적 배경에서 발현되어야만 한다. 과거에는 세포들이나 생물체들의 반응들은 적은 규모나 제한된 상황에서 연구되었다; 예를 들어 어떤 시간에 하나의 유전자나 경로. 새로운 기능 게놈학 분야에서의 목표는 새로운 기술들을 큰 규모를 빠른 시간 내에 처리하는 방식의 유전자발현 연구로 바꾸는 것이다. 이러한 접근은 생화학, 세포생물학, 생리학, 약학이 전통적으로 제공하던 생물학적 과정을 상세하게 이해하는 결과를 낳지는 않겠지만, 생물학자들로 하여금 복잡한 system들을 새롭고 포괄적이며 전체적으로 이해하도록 하며 서열과 기능사이의 빈자리를 좁히도록 해줄 것으로 믿고 있다. 지난 몇 년간에 걸쳐 축적된 많은 양의 게놈과 cDNA (EST) 서열자료들 때문에 genome-wide expression 연구들에 대하여 생각하는 것이 가능해졌다. 예를 들어 거의 20개 정도의 원핵생물들과 단세포인 효모의 게놈들의 완전한 서열들이 이용가능해졌다. 후생동물인 Caenorhabditis elegans의 게놈분석도 완료되었으며, 사람의 게놈도 2005년 까지는 이용가능할 것으로 예상되며, 생쥐의 것도 2008년까지는 완료될 것으로 보고 있다. 이러한 서열들은 서열상동성 연구에 의해 추론된 것들 말고는 기능적인 정보가 결여되어 있다. 분명히 21세기의 생물학자는 이런 모든 서열자료들에 내재하는 기능들을 연구하고 이해할 수 있는 새로운 기술을 요구할 것이다.

        현재 많은 노력이 그러한 기술의 개발로 향하고 있다. 이러한 기술로는 mRNA profile들을 대규모의 빠른 속도로 연속 또는 병렬 (serial and parallel) 방식으로 연구하고자 하는 방법부터 시작되고 있다. 핵산들은 간단하고 다루기가 용이하기 때문에 연구자들은 mRNA 수준의 측정을 포함하는 기술들을 개발함으로써 시작하였다. Proteomics는 궁극적으로 유전자발현의 효과에 대한 보다 상세한 정보를 제공할 것으로 추정된다. 이러한 기술과 자원들 (예를 들어 모든 인체 단백질에 특이적인 항체들의 배열)의 발달은 이제 시작하고 있다. 그럼에도 불구하고 mRNA expression profiling을 수행함으로써 배울 수 있는 것은 매우 많으며 이러한 목적에 이미 이용될 수 효과적인 기술들도 몇가지 있다.

        

Gene expression arrays

        이러한 실험적인 접근들은 glass에 고정화된 (microarrays라 명명) 많은 cDNA들의 수집물들 (EST clone inserts)이나 silica wafer들 또는 chip들에 고정화된 합성 oligonucleotide들의 세트 (probe array들이라 명명)들을 필요로 한다. 이러한 array 형태는 membrane이나 여과지에 고정화시켜 방사능 탐침으로 분석하던 방식에서 비롯된 것이다. 이러한 방식들은 현재 상업적으로 이용가능하며 (URL box 참조) 새로운 기술에 대신한 저비용의 대체물로서 제공될 수 있을 것이다.

        어떤 array 방법이던 실험은 동일한 방식으로 진행된다. RNA들은 연구될 세포나 조직들로부터 추출되어야만 한다. 그리고 추출물내의 mRNA로부터 '표지된 (tagged)' cDNA나 cRNA가 만들어져야만 한다. 그 산물 (방사능동위원소나 형광 nucleotide analog들로 표지된)은 array에 hybridization되고 붙지않은 것들은 씻어진다. Array들은 광학적으로 검사되어 그 결과가 분석된다. 앞으로도 기존의 방법들을 향상시킬 수 있는 다양한 과제들이 남아있을 것이다. 그러한 것들은 세가지 분야에 놓여있다: 생화학, 기계화 (instrumentation), 그리고 정보학 (informatics)이다.

 

Biochemistry

        발현자료들의 해석을 촉진하기 위해서는 연구되어질 mRNA의 source가 가능한 균일하여야만 한다. 유전자의 삽입이나 결실 또는 약학이나 생리적인 조작으로 변화된 배양된 세포들은 발현연구에 적절하다. 왜냐하면 이들로 부터는 충분한 양의 RNA를 얻을 수 있기 때문이다. 그러나 이상적으로 세포주 외에도 사람이나 동물 조직들을 연구하고 싶어할 것이며, 그리고 대부분의 조직들은 많은 다른 세포들로 구성되어 있다. 미세절개 (microdissection) 방법들은 분석에 필요한 특정한 세포들의 분리를 가능케할 것이나 그러한 세포들 (숫자상으로 1000개 이하)로부터 얻어지는 RNA는 너무 적을 것이다. 그 결과 매우 적은 양의 RNA를 역전사하고, 증폭시켜 표지케 하는 방법들이 고안되고 있다; 희망컨데 이러한 방법들은 또한 초기물질들의 상대적인 농도들을 유지할 수 있을 것이다.

        가장 중요한 그러나 거의 논의되지 않은 다양한 세포나 조직들로부터 mRNA를 준비하는 것과 관련된 문제 중 하나는 RNA를 추출하기 전에 시료를 취급하는데 있어서의 차이 (variability)와 이것이 발현양상을 변화시킬지 모르는 효과에 대한 것이다. 배양된 세포일지라도 이런 배경에서 문제점을 보여준다. 그러나 이것이 생검, 외과적 처치, 또는 부검의 결과로 얻어지는 인체조직 시료들에서 얼마나 귀찮은 문제를 제기할 지는 감지하기가 힘들다. 병리학에서는 거의 피할 수 없는 정규적인 과정인 산소결핍이나 상온에서의 방치 기간의 차이는 의심할 나위 없이 유전자발현 pattern을 해석하는데 귀찮은 문제가 될 것이다. 이러한 인위적인 결과들이 반복된다면 확인을 통해 연구중인 생물학적 상태나 현상으로부터 야기되는 원래의 특이적인 변화들을 보여줄 수 있게 자료분석의 과정에서 제거될 수도 있을 것이다.

        생화학자들의 두 번째 과제는 proteomics의 방법을 개발하기 위한 것으로 조직추출물에 있는 모든 단백질과 펩타이드들을 찾아 확인하고, 그 활성과 변형 상태를 비교하는 것이다. 그 외에도 상상할 수 있는 것은 단백질 array를 사용하여 다른 단백질, 핵산, 탄수화물, 지질, 또는 보다 작은 리간드들과의 특이적인 상호작용을 분석하는 것이다.

 

Instrumentation

        현재 가장 앞선 발현 system은 매우 비싸기 때문에 그 기술이 개발되고 있는 큰 제약회사나 실험실에서만 이용가능하다. Filter-based system 조차도 비용이 많이 든다. 가장 장은 filter array를 만들기 위해서는 robot를 만들어야하며 , cDNA들을 주문하거나 증폭하여, 서열분석을 통해 확인한 후, 배열하여야 한다. 이것은 대부분의 연구소나 연구자에게는 비현실적인 것이다. Filter-based system 조차도 비교적 비싸고 비교적 적은 수의 유전자들을 가지며, 단지 몇번 정도만 재활용이 가능하다. 그러한 array들의 장점은 phosphorimager (또는 X-ray film도 정성적인 결과에 대해 가능)로 스캔이 가능하기 때문에 고가의 형광분석기가 필요없다는 것이다. 실험 경비가 낮아지기 전까지는 실험횟수와 실험당 replicate의 수는 제한을 받을 것이다. 단지 몇 개의 replicate 만으로는 mRNA 수준의 차이가 크게 나는 경우 (10 배 정도)에만 그 결과를 믿을 수 있을 것이다. 일단 이 '믿을 수 있는 과일 (low-lying fruit)' (즉, 가장 분명한 새로운 현상)이 따진다면 생물학자들은 새로운 발견을 하기위해 훨씬 더 민감하고 다양한 '신호들 (signals)'을 추구할 필요가 있을 것이다. 현재의 실험적, 통계적 informatics 도구들이 이 임무를 수행할 수 있을 지는 분명하지 않다.

 

Informatics

        대규모의 신속한 실험 방법들은 어울리는 정보처리와 분석체계를 필요로 한다. Array들을 고안하고, 물질들을 추적하며, 수집분석하고, 유전자발현으로부터 자료를 해석하는 소프트웨어와 데이터베이스 시스템은 아직 초보단계이다. 무엇보다도 이들은 한번의 실험에서 수천개 유전자들의 발현양상을 목록화하고 이어서 조직간의 발달병리학적 상태 또는 세포혼란을 비교해주어야 한다.

        매우 많은 양의 자료가 실험 전후에 처리되어야만 한다. 왜냐하면 모든 서열들, 주석들, 그리고 대상 생물체의 유전자들에 대한 물리적인 DNA 자원들에 대한 직접적인 접근이 요구되기 때문이다. Hybridization과 array에서 관찰되는 상대적인 발현수준 후에 이들 자료는 저장보존되어 영상처리와 통계적-생물학적 분석에 이용되어야만 한다. 후자는 절대량 또는 상대적인 양에서 통계적으로 큰 차이를 보이는 전사물들을 확인하는 것을 포함한다. 일단 이것이 이루어지면 여러 가지 임무들이 수행되어야 한다. 가장 분명하면서도 직접적인 것은 유전자산물들의 구조와 기능들을 관한 정보를 제공하는 것이다. 이 정보를 해석하는 것은 자료들을 다른 방식으로 분석할 수 있는 연구자들의 책임이다. 특정한 전사물들이 속하는 생화학적 경로가 확인될 수 있거나, 또H는 그 전사물이 상호작용할 것으로 생각되는 유전자들이 발견될 수도 있을 것이다. 시간경과에 따른 실험들에서는 유사한 시간적 발현양상을 보이는 유전자들이 찾아질 수 있다. 나중에는 자료들을 미리 해석할 수 있고 (생화학적 지식과 heuristics의 세트를 사용하여) 연구자에게 그 의미에 대한 대안의 가설이나 설명을 제시해줄 수 있는 소프트웨어가 만들어질 수 있을 것이고, 또 그렇게 되어야만 할 것이다. 이런 방식으로만이 변화를 가지는 수만개의 유전자들을 다루는 실험들을 해낼 수 있을 것이다.

        수천개의 유전자발현 실험들로부터의 자료가 변화분석 (meta-analysis)에 이용될 수 있을 때를 기대하는 것은 매우 흥미있는 일이다. 변화분석 (meta-analysis)는 많은 개개의 연구들로부터의 인위적인 결과들을 헤아려 추려낼 수 있는 능력을 가진 것으로 이를 통해 좀더 상세한 발견과 확실한 결과들을 이끌어낼 수 있을 것이다. 이것은 자료가 그것을 만드는데 사용되는 특정한 발현기술과는 무관할 수 있는 단일한 구조와 형식의 어떤 유형을 고수하기를 요구할 것이다. 이러한 대규모의 전자적인 자료의 여러 가지 발표양식들의 장점과 약점들은 이미 논의되기 사작하였다. 

(by Michael J. Brownstein, Jeffrey M. Trent, Mark S. Boguski)