The Central Dogma of Molecular Biology
지구상에 존재하는 모든 생물체는 나름대로의 생명 활동을 영위하고 있다. 이러한 생명 활동의 가장 바닥에 깔려 있어 모든 생물체에 동일하게 적용될 수 있는 법칙이 하나 있는데 그것을 생물학에서는 중심설(central dogma)이라고 한다. 이러한 central dogma는 분자생물학, 아니 더 나아가 모든 생물학 분야의 기초가 되는 아주 기본적이고도 중요한 법칙이라고 할 수 있다. 유전 정보의 흐름을 나타내는 분자 생물학의 기본 원리인 central dogma는 1958년 Francis Crick에 의해 처음으로 제안되었고, 1970년에 Nature 잡지에 다시 재게되었다. 분자생물학의 central dogmna를 한 마디로 말하면 다음과 같다. “모든 유전 정보는 일방통행으로 전달된다. 즉 DNA가 주형으로 작용하여 RNA가 전사되고, 이 RNA가 갖고 있는 정보는 다시 단백질(protein)로 번역된다.” 다시 말하면 정보가 일단 단백질로 전송되면, 핵산 (DNA,RNA)으로 역전송될 수 없다고 할 수 있다. 그럼 지금부터 central dogma에 대해 차례대로 자세하게 알아 보기로 하겠다.
1. 생명체의 정보 저장소, 염색체 - 세포의 최우선 과제는 자신을 복제하는 것이다. 이렇게 생물체가 자신을 복제하는 것을 통해 우리는 모든 살아 있는 생물체가 하나의 세포로부터 출발한다는 것을 알 수 있다. 이는 생물체를 이루는 데 필요한 모든 정보가 하나의 세포 안에 들어 있기 때문이다. 그런데 그 정보는 한 세포의 모세포로부터 주어진 것이고 그 모세포의 정보는 또 그의 조상세포로부터 전해진 것이다. 식물과 동물의 세포 내부에서 발견되는 그 정보의 운반자는 염색체이다. 이 염색체는 세포의 핵이 두 개로 나뉘기 직전에 실가닥 같은 모양을 분명하게 드러낸다. “염색체 (chromosome)"란 단어는 ”colored body"란 뜻이다. 과학자들은 현미경으로 세포를 쉽게 관찰하기 위해 염료를 사용하였는데 이것이 염료를 잘 흡수하는 까닭에 염색체라 이름지어졌다. 모든 생물은 종에 따라 특정한 개수의 염색체를 가지고 있다, 그 염색체는 비슷한 모양이 붙어 있는 한 쌍으로 되어 있는데 한쪽은 부계로부터, 다른 한쪽은 모계로부터 받은 것이다. 예를 들어 사람은 23쌍의 염색체, 즉 46개의 염색체를 가지고 있다. 난자와 정자를 제외한 인체의 모든 세포는 동일한 수의 염색체를 가지고 있다. 난자와 정자를 제외한 인체의 모든 세포는 동일한 수의 염색체를 가지고 있다. 그런데 생식세포는 정확히 절반인 23개를 가지고 있다. 이는 두 생식세포가 만나서 하나의 생명체를 만든다는 것을 볼 때 들어맞는 수이다, 사람의 난자와 정자가 만날 때 부계로부터 23개, 모계로부터 23개의 염색체가 합쳐짐으로써 수정란은 양쪽으로부터 각각 유전 정보를 물려받게 된다. 이렇게 해서 생물체는 염색체의 수를 대대로 일정하게 유지시킨다. 수정 과정에서의 염색체의 행동과 멘델의 유전법칙과의 연관성을 살펴본 과학자들은 유전자가 염색체 상에 반드시 존재한다고 믿게 되었다. 1910년 미국의 유전학자 모건은 초파리의 교잡 실험에서 우연히 얻은 결과를 통해 이러한 생각이 옳다는 것을 증명하였다. 모건은 돌연변이된 수초파리가 정상적인 붉은색이 아닌 흰색 눈을 갖는다는 것을 발견하였다. 그는 또한 돌연변이된 초파리를 계속해서 번식시키는 실험을 통해 흰 눈을 나타내는 유전 형질이 X와 Y의 염색체 중에서 X염색체를 항상 따라다니는 것을 발견하였다. 모건은 이 결과를 통해 눈동자 색을 나타내는 유전자가 X염색체 안에 있다는 것을 깨닫게 되었다. 이는 오늘날 잘 알려진, 성과 연관된 유전 현상인 반성유전의 예가 되었다. [참고 ; 초파리 중에서도 특히 노랑초파리 (Drosophila melanogaster)는 20세기 초기의 유전학 실험에서 기본적으로 이용되었다. 초파리는 유전 실험에 가장 이상적이었는데, 기르기가 쉽고 비용이 적게 들며 2주의 짧은 생명 주기를 가지면서도 모든 유전 정보를 불과 4쌍의 염색체에 가지고 있기 때문이다.]
2. DNA의 발견 - 1869년 스위스의 젊은 화학자 미셔(Johann Miescher)는 세포핵에 있는 화학 물질에 관심이 많았다. 그는 고름의 백혈구에서 추출한 물질을 분석하여 “핵물질”이라고 이름지었다. 수년 후에 그는 인을 함유한 산(acid)을 그 물질로부터 분리하였고 그것을 “핵산”이라 명명하였다. 미셔는 유전자를 구성하는 DNA(deoxyribonucleic acid)를 발견하였던 것이다. 그러나 그 후 75년이 지나도록 이 분자의 중요성은 알려지지 않았다. DNA의 발견과 그것이 유전 물질이라는 것을 알아내기까지 이렇게 긴 시간이 흐른 것은 아이러니한 일이다. 과학자들은 유전 정보가 큰 분자 속에 기록되어 있을 것이라고 생각했다. 그들은 마치 한 단어가 여러 글자들로 이루어져 있는 것처럼 작은 소단위의 연결체로 되어 있는 큰 분자들만이 유전 정보를 담을 수 있다고 생각하였던 것이다. 따라서 과학자들은 크고 복잡한 단백질 분자들이 이런 기능을 하는 데 적합하다고 여겼다. DNA는 너무 작고 단순하기 때문에 생명체를 이루는 방대한 유전 정보를 담기에는 적합하지 않다고 생각해 왔던 것이다. 1928년 영국의 과학자 그리피스(Fred Griffith)는 현재 Streptococcus pneumoniae(폐렴쌍구균)으로 불리우는 bacterium pneumococcus에서의 형질 전환 (transformation) 실험을 통해 과학자들의 그릇된 생각을 바로잡았다. 이 실험에서 두 종류의 박테리아가 이용되었는데, 하나는 결핵을 일으키는 치명적인 박테리아 (smooth형; colony가 반질반질하고 전염성의 특성을 갖음)였고 다른 하나는 그것의 돌연변이형으로 병을 전혀 일으키지 않는 박테리아였다.(rough형; colony가 덜 반질반질하고 크기가 작음, 전염성이 없음) 그리피스는 무해한 변종 박테리아를 쥐에 주사하였고 EH한 치명적인 박체리아를 미리 열처리하여 죽인 후 다른 쥐에 주사하였다. 예상대로 두 경우 모두 쥐는 병에 걸리지 않았다. 그러나 무해한 변종의 박체리아를 열처리를 가해 죽인 박테리아와 함께 주사한 경우에는 대분분의 쥐가 이틀 이내에 죽었다. 처음에 과학자들은 죽은 박테리아가 살아난 것에 놀라 이 사실을 밎지 않았고 죽은 박테리아의 치명적 성질이 무해한 박테리아로 전달되었다는 “형질 전환 인자” 이로는을 의심하였다. 하지만 이 형질 전환 인자는 결국 유전 물질이었고, 이로 인해 죽은 박테리아로부터 살아 있는 박테리아로 치명적 성질이 전달되었던 것이다. 만약 이때 이 형질 전환 인자가 잘 연구되고 정립되었다면 과학자들은 유전자가 무엇으로 되어 있는가 하는 것을 알 수 있을 것이다. 그 나머지 수수께끼는 1944년 뉴욕의 에이버리(Oswald Avery)와 그의 동료 과학자인 Colin MacLeod, Maclyn McCarty에 의해서 결국은 풀리게 되었다. 이들은 그리피스가 했던 실험과 유사한 형질 전환 실험을 하였고 전염성있는 박테리아 세포로부터 형질 전환하는 물질의 화학적 성질을 정의하고자 하였다. 즉 수년 동안에 걸쳐 박테리아를 갈아 추출물을 정제, 분리하고 화학 물질을 가하여 형질 전환을 일으키는 물질을 순수하게 분리하고 동정해 내고자 한 것이다. 먼저 추출물로부터 유기용매를 사용하여 단백질을 제거해 보니, 추출물은 아직 형질전환할 수 있었다. 다음 이들은 다양한 효소 사용하는 것을 시도하였다. 단백질을 파괴시키는 트립신(trypsin), 키모트립신(chymotrypsin)은 형질전환에 아무 영향을 끼치지 못한다는 것을 알게 되었다. RNA를 분해하는 ribonuclease 역시 마찬가지였다. 이 두 실험은 형질 전환 물질로써 단백질이나 RNA는 아니라고 결론이 나왔다. 반면 Avery와 그의 동료들은 DNA를 분해하는 DNase(deoxyribonuclease) 효소가 치명적 성질의 박테리아 세포 추출물의 형질 전환하는 능력을 파괴시킨다는 것을 알게 되었다. 즉 그들이 마지막에 발견한 것은 결구 DNA였고 유전 정보를 전달하는 것은 DNA가 틀립없다고 결론짓게 된 것이다. 순수 정제된 형질 전환 물질이 DNA라는 가설을 뒷받침해 주는 데는 직접적인 물리적, 화학적 분석이 있었다. Avery와 그의 동료들이 사용한 분석 도구에는 4가지가 있다. 먼저 1) 초원심 분리(ultra centrifugation)이다. 그들은 형질 전환하는 물질을 초원심분리기에 집어 넣어 물질의 크기를 측정하였다. 형질 전환하는 능력을 가진 물질은 빠른 속도로 초원심 분리기 튜브 바닥에 가라않았는데, 이는 DNA의 성질 중 하나인 매우 높은 분자량을 의미한다. 2) 전기영동(electrophoresis)이다. 그들은 형질 전환하는 물질을 전기장에 놓음으로써 얼마나 빨리 이동하는가를 관찰하였다. 형질 전환 물질은 상대적으로 빠른 운동성을 보였는데 이 역시 DNA의 성질을 설명해 준다. 그 이유는 DNA는 질량에 비해 charge가 큰 편이기 때문이다. 전기영동에서의 이동하는 속도는 (-)charge를 많이 띄면 띌수록, 분자 크기가 작을수록 빨리 이동한다. 3) 자외선 흡수 분광기(ultraviolet absorption spectrophotometry)이다. 그들은 분광기 안에 형질 전환하는 물질이 들어 있는 용약을 놓고 어떤 종류의 자외선을 강하게 흡수하는지를 관찰하고자 하였다. 확인해 본 결과 형질 전환하는 물질의 흡광 스펙트럼은 DNA와 일치하였다. 즉 그 물질들이 가장 강하게 흡수한 빛의 파장은 260nm였고, DNA의 흡광도를 가장 많이 나타내는 파장 역시 260nm인 것이다. 반면 단백질의 흡광도가 가장 높게 나타나는 위치는 280nm이다. 4) 기초 화학 분석 (elementary chemical analysis)이다. 분석 결과 형질 전환하는 물질들의 N/P ratio(질소와 인의 비)는 상대적으로 P의 양이 많아 비는 작은 것이 확인되었는데, 이 역시 DNA의 성질과 같다고 할 수 있다. 반면 단백질은 N/P ratio가 높다. 즉 질소의 함량이 높고, 인이 거의 없다고 할 수 있는데 이는 인을 가지고 있는 아미노산이 거의 없기 때문이라고 해석할 수 있다.
3. DNA의 구조 - 1930년대와 1940년대에 걸쳐 분자생물학은 놀랄 만한 발전을 거듭했다. 과학자들은 유전성에 관한 물리적인 기초를 빠른 속도로 이해하게 되었고 세포의 감추어진 내부 기작을 밝히는 데 근접했다. 그들은 다음과 같은 사실을 알게 되었다. 1) 유전 형질은 유전자 (gene)라는 뚜렷이 구별되는 실체에 d의하여 조절된다. 2) 유전자는 세포핵 안에서 발견되는 실타래처럼 생긴 염색체 (chromosome) 안에 있다. 3) 유전자는 DNA로 만들어져 있다. 이와 같은 사실로 인해 과학자들은 분명히 이 DNA라는 분자를 들여다 볼 필요가 생겼다. 그들은 원자 구조를 분석할 수 있는 새로운 도구와 기술을 이용하여 DNA 탐구에 박차를 가하였다. “생명이란 무엇인가”라는 질문에 대한 답을 찾기 위해 이제 새포 탐구에서 화학 물질 탐구 쪽으로 그들의 관심을 조심스럽게 옮기기 시작한 것이다. 그러나 사실 이 개념은 새로운 것이 아니었다. 1700년대 후반에 이미 근대 화학의 아버지인 라부아지에는 뛰어난 통찰력과 추론으로 “생명은 화학 작용이다”라고 한 바 있었다. 과학자들은 분석을 통하여 DNA가 어떤 화학 성분으로 되어 있는지 알아냈다. 그 기본 골격을 이루는 것은 염기(base), 인산(phosphoric acid),그리고 당(deoxyribose)이었다.(그러므로 DNA라는 이름은 deoxyribonucleic acid라고 불리워지게 된 것이다. 유사하게 RNA는 염기, 인산, 그리고 DNA와는 달리 ribose 당을 가지고 있다. DNA에서 발견된 4종류의 염기는 질소를 함유하고 있는데 구아닌(G, guanine), 시토신(C, cytosine), 티민(T, thymine), 아데닌(A, adenine)이라고 부른다. 반면 RNA 역시 똑같은 염기를 가지고 있지만 T대신 우라실(U, uracil)을 가지고 있다. A와 G는 purine이라고 불리는 분자에 속하고 T와 C는 pyrimidine에 속한다. (RNA의 경우 U) 핵산에서 발견되는 당의 구조를 살펴 보면, deoxyribose와 ribose사이의 다른 점이 있다. 즉 ribose의 2번 탄소 위치에 OH(hydroxyl)이 있지만, deoxyribose의 경우 OH대신 O(산소)가 빠져 H(수소)만이 있는 것을 확인할 수 있다. RNA와 DNA에서의 염기와 당은 서로 묶여 있는 상태이고 nucleoside라고 부른다. 그리고 결합한 염기에 따라 이름은 바뀌게 된다. (예: adenosine - deoxyadenosine) DNA와 RNA의 소단위체들을 nucleotide라고 부른다. 즉 phosphodiester bond를 통해 nucleoside에 phosphate group(인산기)이 붙은 것이다. Ester는 유기화합물로써 알콜과 산으로부터 형성된다. Nucleotide의 경우, 알콜 그룹은 당의 5번 hydroxyl기가 되고, 산(acid)은 인산이 되어 ester를 phosphoester이라고 부르는 것이다. DNA와 RNA에서 nucleotide를 서로 결합시켜 주는 것을 phophodiester bond라고 부른다.왜냐하면 2개의 당에 연결된 phophoric acid를 포함하고 있기 때문이다. 하나는 당의 5번 그룹을 통하여 다른 하나는 당의 3번 그룹을 통하여 연결된다. 분자의 가장 윗부분은 5번 인산 그룹을 가지게 되고, 따라서 5번 end라고 부른다. 또한 가장 밑부분은 3번 hydroxyl기를 가지게 되어 3번 end라고 부르게 되는 것이다. 그러나 그 당시에는 “어떻게 이 몇 종류의 작은 분자가 연결되어 큰 DNA 분자를 이루는가” 하는 중요한 의문은 해결되지 않았었다. 그런데 이 질문에 대한 답을 얻는 것은 사실 “어떻게 DNA가 무한한 유전 정보를 저장하고 전달하는가”를 알아내는 것과도 같은 것이었다. 그 답은 1953년 케임브리지 대학의 젊은 두 과학자 왓슨(James Watson)과 크릭(Francis Crick)에 의해 밝혀졌다. 그들은 철사를 구부리고 용접해서 사람 키만한 분자 모델을 만들었다. 그 형태는 비교적 단순한 두 가닥으로 된 나선형 모델(double helix)이었는데, 그 당시까지 알려진 DNA에 관한 모든 사실을 만족시키는 최적의 분자 모델이었다. 이것이 바로 오늘날 잘 알려진 이중나선이다. 굽은 모양의 나선형 계단에서, 우아한 모양의 굽은 난간 위치에는 당과 인산이 교대로 배치되어 있고 계단의 디딤판에 해당하는 위치에는 각각 한 쌍의 염기가 결합되어 있다. 이 구조의 발견으로 역사적 전환이 일어났으며 유전자 조작의 새로운 시대가 펼쳐지게 되었다.
4. DNA의 정보 저장 - DNA의 놀라운 정보 저장 능력의 열쇠는 네 개의 다른 염기(G, C, T, A)에 있다. 그 염기들은 마치 유전 정보를 적어놓은 알파벳과도 같다. 예를 들어보면 계단의 아래에서 위를 향해 올라가면서 디딤판 왼쪽의 염기를 하나씩 읽어보면 가령 AGGTCTATCAGC 등의 염기 서열을 읽게 될 것이다. 다시 계단의 위에서 아래로 내려가면서 반대쪽 염기를 하나씩 읽어보면 완전히 다른 염기 서열을 발견하게 될 것이다. 사실 이 네 개의 염기는 DNA 분자에서 무한한 순서로 배열될 수 있다. 여기서 한 종류의 주어진 서열은 한 종류의 유전자를 말하는 것이다, 유전자는 특정한 염기 서열과 특정한 길이를 갖게 된다. 이것이 바로 DNA가 유전 정보를 기록하는 방법이다.
5. DNA의 복제 - 한 사람의 몸을 이루는 수많은 세포의 DNA는 궁극적으로 서로 동일하다. 잉태되는 순간에 생긴 최초의 한 세포로부터 완전한 인체가 되기까지 세포는 스스로를 복제해 나가는데, 이때 DNA 분자도 세포가 두 개로 복제될 때마다 자신을 복제한다. 그래서 결국 모든 세포에 동일한 DNA가 있게 되는 것이다. 또한 DNA 분자가 스스로를 복제하는 방법의 열쇠는 이중나선의 각 가닥에 있는 염기가 서로 특정한 짝을 이루고 있다는 점이다. DNA에는 네 개의 염기가 있지만 오직 두 종류만의 짝이 있는 것을 볼 수 있다. 염기 A는 항상 염기 T와 결합을 하는데 수소 결합으로 이중 결합의 성격을 띄게 된다. 반면 염기 G는 염기 C와 삼중의 수소 결합으로 연결되어 있다. 염기가 짝을 이루는 이러한 방법 때문에 이중나선의 한 가닥의 염기 서열이 정해지면 다른 한 가닥의 염기 서열은 결국 예측할 수 있는 순서로 정해지게 된다. DNA 분자가 자신을 복제하기 위해서는 이중나선의 두 가닥을 벌려서 각각의 가닥에 이 맞는 염기와 다른 부품을 붙여 나가기만 하면 되는 것이다. 여기서 원래의 DNA의 각 가닥은 새로운 가닥을 만들기 위한 염기 서열의 원판으로 사용되는 것이다. 이렇게 해서 만들어진 새로운 두 개의 이중나선은 원래의 DNA와 동일한 염기 서열을 각즌 완전한 복제품이 된다. 이제부터 DNA의 자세한 기작에 대해서 설명해 보겠다. 1) 두 개의 부모 가닥 (parent strand)은 DNA helicase의 도움으로 풀리게 된다. 2) 외가닥의 DNA binding 단백질들이 풀려진 각각의 가닥에 붙게 됨으로써, 떨어진 부모 가닥들이 재결합하는 것을 방지한다. 3) 풀려진 가닥들은 leading 가닥과 lagging 가닥의 DNA polymerase에 쉽게 결합을 하게 되는데, 이는 elongation(신장)을 촉진한다.(DNA polymerase는 그 자신의 역할에 대해서 정확성을 스스로 체크하기도 한다) 4) Leading 가닥 상에 있는 DNA polymerase가 계속 작동하고 있을 때에, RNA primer(전구물질)은 Okazaki fragment의 합성을 촉진하기 위하여 lagging 가닥 상에서 반복적으로 필요로 하게 된다. Primosome이라고 불리는 그룹 내에 서로 붙어 있는 몇몇의 polypeptide 중의 하나인 DNA primase는 primer가 붙는 것을 도와 준다. 5) 결국 각각의 새로운 Okazaki fragment는 DNA ligase에 의해 촉매되어진 반응 내에서 lagging 가닥의 완전한 한 부분에 붙게 된다. 이렇게 DNA 복제 기작은 많은 효소들이 관여하는 과정에서 자신의 정보를 복제하게 되는 것이다.
6. 유전자의 역할 - 유전자가 DNA 분자 안의 특정한 염기 서열로 되어 있다는 것만으로는 만족스러운 설명이 되지 않는다. 염기가 실제로 무엇을 어떻게 하는가는 설명되지 않기 때문이다. 예를 들어 우리는 일반적으로 유전자를 푸른 눈 또는 갈색 눈을 나타내게 하는 것 정도로 알고 있다. 그러면 DNA의 염기 서열이 어떻게 그렇게 만드는 것일지 의문점을 가지게 될 것이다. 실마리를 구하기 위해서 영국의 의사 개로드 (Archibald Garrod)와 그의 환자의 예를 살펴 볼 수 있다. 1902년에 개로드는 알캅톤뇨증 (alkaptonuria)이라는 질병을 관찰하였는데, 이 환자는 소변 내의 특정한 산에 의해 소변이 공기에 노출될 때 검게 변하는 증상을 보였다. 이 병은 어떤 가족의 경우 여러 세대에 걸쳐 내려 오는 것으로 알려져 있었기 땜누에 분명하게 유전되는 것이고 또 유전자에 의해 조절되는 것이었다. 정상인에게서는 소변을 검게 하는 그 특정한 산이 화학 반응으로 인해 신체 안에서 분해된다. 개로드는 논리적으로 이 환자에게는 필요한 반응을 일으키는 그 무언가가 결핍되어 있다고 결론지었다. 자세히 말하면 이 환자에게는 특정한 효소 (특정한 단백질로서 신체의 내부 온도에서 화학 반응이 빨리 일어나도록 하는 생물학적 촉매)가 결핍되어 있었다. 이 병이 유전성을 나타내므로 개로드는 유전자가 효소를 만드는 명령을 구성한다고 추론하였고 또 유전자가 다른 단백질을 만드는 것과도 관련이 있다고 추측하였다. 그의 추측은 옳은 것이었다. 그러나 40년이 지난 후에야 독창적인 실험에 의해 이 추론이 옳다는 것을 완전히 증명할 수 있게 되었다. 자세하게 이 병에 대해서 설명해 보겠다. 알캅톤뇨증은 티로신 (tyrosine)의 분해에 결함이 생겨 알캅톤을 소변으로 배출시키는 대사장애 일환이라고 할 수 있다. 상염색체의 열성으로 유전되는 질병으로, 티로신의 분해에 결함이 생겨서 알캅톤 (alkapton)을 소변으로 배출시키는 열성 유전성 대사장애 질병인 것이다. 호모겐티신산 산화효소 (homogentisic acid oxidase)의 선천성 결손에 의해 나타난다. 효소의 이상에 의하여 축적된 호모겐티신산은 공기 중에서 쉽게 산화되어 흑색의 멜라닌 모양의 물질이 되기 때문에 결합조직에 침착하여 조직이 갈색으로 변하는 조직갈변증이 나타난다. 소변은 방치하면 흑색으로 변화하는데, 알칼리를 첨가하면 더욱 빨리 흑색으로 변하게 된다. 성인의 경우에는 조직갈변증, 골관절염 등이 나타나며, 순환기 증세로는 심장판막장애, 동맥류를 합병하는 경우가 많다. 또한 동맥경화증과 심장판막에서 석회침착이 일어나며 심근경색증에 의하여 사망하는 경우가 많다. 1941년에 스탠퍼드 대학의 유전학자 비들 (George Beadle)과 데이텀 (Edward Tatum)이 유전자와 효소는 의심할 여지 없이 관련되어 있다는 것을 증명하여 획기적인 돌파구를 마련하였다. 그 변이주는 정상적인 곰팡이가 자라는 데 필요한 여러 필수 영양소(아미노산이나 비타민) 중 어느 한 가지를 만드는 능력이 결핍되어 있었는데 그 결핍은 결국 필수 영양소를 만드는 효소의 결핍 때문이었다. 배양접시의 영양분 조성을 여러 조합으로 바꾸어 변종들에게 정확히 어떤 효소가 결핍되어 있는지 알아보았다. 이렇게 확인된 여러 종류의 변종은 다시 그 염색체를 조사하여 염색체 상의 어떤 위치에서 그 변이 현상이 일어나는가를 알아내었다. 여러 변종의 효소 결핍은 염색체 상의 각기 다른 위치와 관계되어 있음을 알게 되었는데 이는 서로 다른 유전자가 각각의 효소에 연계되어 있음을 의미하는 것이었다. 이제, 유전자는 어떤 일을 하는가 하는 질문에 대답할 수 있을 것이다. 그 답은 “유전자는 여러 종류의 단백질을 만드는 명령이다”라고 할 수 있다. 푸른 눈과 갈색 눈, 그리고 양과 사람의 차이가 단지 유전자의 차이에서 올 수 있는 것이다.
7. 단백질 입문 - 일반인들에게 단백질은 식품의 영양 서분 중의 하나이지만 분자생물학자에게 단백질은 살아 있는 심오한 시스템이다. 궁극적으로, 살아 있는 세포의 모든 반응과 그 산물은 단백질에 의존한다. 단백질이 수행하는 수많은 일의 예는 다음과 같다. 필수적인 화학 반응의 촉매, 세포간의 신호 전달 매개, 감염체와의 싸움, 세포의 막, 힘줄, 근육, 피, 뼈 및 그 밖의 다른 세포 구조물 형성 등을 들 수 있다. [참고; 단백질의 예 - 1) 구조 단백질 ① 콜라겐 (뼈와 피부에서 발견됨) ② 케라틴 (머리카락과 손톱 등을 만듬) ③ 피브린 (혈액 응고를 도움) ④ 엘라스틴 (인대의 주성분) 2) 기능 단백질 ① 호르몬 (신체의 기능을 조절함) ② 항체 (감염 물질을 공격함) ③ 효소 (신체 내의 화학 반응을 촉진함) ④ 헤모글로빈 (혈액에서 산소를 운반함)] 그러므로 단백질은 모든 세포의 성질을 규정하게 된다. 즉 우리는 단백질이 생명체 그 자체를 만든다고 말할 수 있다. 췌장의 호르몬 분비세포와 사람의 팔근육세포, 눈의 신경세포, 갈비의 뼈세포 등 세포의 서로 다른 특성은 단백질로부터 온다. 또한 사람의 머리카락과 양의 털, 참새의 깃털, 금붕어의 비늘 등의 서로 다른 특성도 단백질 때문이다. 이와 같은 다양한 단백질의 기능에도 불구하고 모든 단백질 분자는 기본적으로 같은 방법으로 구성되어 있다. 단백질은 아미노산이라고 불리는 작은 분자가 길게 연결되고 접혀 있는 구조물이다. [참고; 20종의 아미노산 이름: G(glycine), A(alanine), V(valine), L(leucine), I(isoleucine), S(serine), T(threonine), F(phenylanine), Y(tyrosine), W(tryptophan), D(aspartate), E(glutamate), N(asparaginine), Q(glutamine), C(cysteine), M(methionine), K(lysine), R(arginine), H(histidine), P(proline)]아미노산은 20종류인데 이를 조합하면 무한한 종류의 단백질을 만들 수 있게 된다. 예를 들어 아주 작은 단백질 중의 하나인 인슐린은 약 50여 개의 아미노산으로 구성되어 있다. 일반적으로 단백질은 수백에서 수천 개의 아미노산으로 구성되어 있는 큰 분자인 것이다. 아미노산의 수, 종류와 배열이 단백질의 구조를 결정한다. 그리고 그 구조는 생물체에서의 기능을 결정한다. 어떤 단백질의 경우 특정 아미노산의 배열에 의해 구조가 민감하게 달라지기도 한다. 마치 잘못된 철자로 인해 완전히 다른 단어가 되는 것처럼 한 아미노산의 변화는 미묘하고도 매우 중대한 영향을 끼치기도 한다. [참고; 인체에는 각기 다른 특성과 목적을 가진 3만 종류 이상의 단백질이 있다. 다른 생물체들도 사람에게 없는 단백질뿐만 아니라 사람과 같은 단백질도 가지고 있다. 효소는 가장 큰 단백질 중의 하나인데 포유동물의 세포는 평균 3,000종류의 효소를 가지고 있다.] 앞에서 언급했던 알캅톤뇨증에서처럼 어떤 질환은 유전적 변이에 의하여 단백질이 잘못 만들어졌거나 단백질이 아예 없게 된 결과이다. 꼬이고 구부러지고 접히는 등의 복잡한 단백질의 3차원 구조는 우리가 실제로 볼 수 있는 세상에 놀랄 만큼 직접적인 영향을 미친다. 단백질의 물리적 구조가 단백질로 형성된 물질의 특성에 직접 영향을 끼치는 것이다. 예를 들면 머리카락과 근육을 만드는 케라틴 분자는 나선형과 스프링형이다. 뼈, 피부, 힘줄에서 발견되는 콜라겐 분자는 밧줄 모양의 구조이고, 비단 섬유에 있는 단백질 분자는 부드럽고 종이처럼 얇은 모양을 하고 있다. 어떤 단백질에 열을 가하거나, 화학 물질을 첨가하거나, 혹은 단순한 물리적인 방법을 가하면 그 모양을 바꿀 수도 있다. 케첩의 예를 들어보면 케첩이 가판대의 병에 들어 있을 때에는 마치 차가운 국수가 달라붙고 꼬여 있는 것과 같은 형태로 긴 단백질 분자가 서로 엉켜 있어서 걸쭉하고 잘 흐르지 않는다. 그러나 병을 흔들면 그 분자를 서로 떼놓을 수 있다. 그러면 떨어진 분자로 인해 케첩은 잘 흐르게 된다. 계란 흰자의 단백질은 반대의 경우다. 흰자를 거품기로 풀면 그 긴 사슬 모양의 단백질이 더욱 단단히 얽히고 서로 붙게 되어 처음에는 끈적거리고 반투명했던 액체가 서서히 굳은 흰 거품으로 변하게 된다. [참고; 유전자와 단백질, 그리고 사람의 눈 - 사람의 눈동자 색은 그 부모로부터 물려받은 유전자에 의해 결정된다. 그러나 더 직접적이고 실제적으로 설명하면 효소의 작용으로 색이 결정되는 것이다. 눈동자의 색은 안구의 홍채색소의 양과 분포에 의해 좌우된다. 이 색소의 생산과 침착은 효소에 의한 여러 화학 작용으로 이루어진다. 예를 들어 푸른 눈을 가진 사람은 홍채에 색소를 침착시키는 효소를 가지고 있다. 다른 종류의 유전자는 다른 종류의 효소 작용을 일으키게 되고 다른 색소를 침착시켜 결국 다른 눈동자 색을 갖게 되는 것이다.] 지금부터는 단백질의 구조에 대해서 더 자세하게 설명해 보겠다.
8. 단백질의 구조 - 유전자 발현을 이해하고 나서 알겠지만, 단백질은 대부분 유전자의 최종 산물이므로 단백질의 성질에 대해서 알 필요성이 있다. 핵산과 같이 단백질은 작은 소단위체의 체인 모양의 중합체라고 할 수 있다. DNA와 RNA의 경우, 서로 연결되어 있는 것은 핵산의 소단위체인 nucleotide들이다. 반면 단백질의 소단위체는 아미노산 (amino acid)이다. DNA는 오직 4개의 서로 다른 nucleotide들을 포함하고 있지만 단백질은 20개의 서로 다른 아미노산으로 구성되 있다. 각각의 아미노산은 아미노 그룹, 카르복실 그룹, 수소 원자, 그리고 측쇄 (side chain)를 가지고 있다. 어떤 두 아미노산 사이에서의 차이점은 바로 side chain에 있다. 그러므로 아미노산의 배열은 바로 그들의 독특한 side chain의 차이에 있는 것이고 결국 각각의 단백질에 독특한 성질을 부여하는 셈이 된다. 아미노산은 펩타이드 결합을 통해 단백질 내에서 서로 결합을 하고 있고, 이는 여러 개의 아미노산 사슬을 뜻하는 폴리펩타이드라고 불리워지게 된 것이다. 하나의 단백질은 아나 또는 많은 수의 폴리펩타이드로 구성될 수 있다. 폴리펩타이드 사슬은 DNA와 마찬가지로 극성을 가지고 있다. Dipeptide는 왼쪽 끝에 아미노 기를 가지고 있다. 이를 N-termicus라고 불리운다. 오른쪽 끝에는 자유로운 카복실 기를 가지고 있는데 이를 C-terminus라고 부른다. 우리는 아미노산의 선형의 배열 순서를 단백질의 1차 구조 (primary structure)라고 부른다. 이들 아미노산들이 다른 아미노산과 상호작용하여 결합하게 되면 2차 구조 (secondary structure)가 된다. α-helix가 바로 2차 구조의 대표적인 예라고 할 수 있다. 이것은 가까운 아미노산들 사이에서 수소 결합에 의해 생긴 결과라 할 수 있다. 단백질 내에서 발견되는 대표적인 2차 구조의 또 다른 예는 β-pleated sheet이다. 이것은 확장된 단백질 사슬로서 수소 결합에 의해 나란히 쌓여 있는 구조를 보이게 된다. 서로 다른 사슬들과의 쌓임은 병풍 구조를 만들게 된다. 실크(비단)는 β-병풍 구조에서 많이 풍부한 단백질이다. 2차 구조의 세 번째 예는 turn이다. 이러한 turn은 α-helix와 β-병풍 구조를 서로 연결한다. 폴리펩타이드의 3차원 모양을 3차 구조 (tertiary structure)라고 한다. 그 대표적인 예로는 마이오글로빈을 들 수 있다. 대부분의 폴리펩타이드들은 3차 구조를 띈다. 즉 단일 단백질로 대부분이 α-helix로 구성되어지지만 전체적으로 봤을 때, 입체 구조를 형성하는 것이다. 4차 구조 (quaternary structure)에서는 2 또는 그 이상의 각각의 폴리펩타이드들이 서로 복잡한 단백질을 만들 때 나타나는 구조를 말한다. 4차 구조는 수소 결합, 이온 결합, 소수성 상호작용, 반데르 발스 힘 등 여러 요소를 포함한다고 할 수 있다. 또 다른 4차 구조는 공유결합이 참여하지 않을 수도 있다.
9. 유전자 코드 - DNA의 구조 중 중요한 것은 앞에서 살펴 본 것처럼 염기, 당, 인산의 세 분자가 결합된 하부 구조가 계속적으로 반복된다는 것이다. 이 하부 구조는 뉴클레오티드 (nucleotide)라고 불리며 DNA의 근본이 되는 요소이다. 앞에서 설명한 바와 같이 DNA에는 네 종류의 염기가 있으므로 네 종류의 뉴클레오티드가 있게 된다. 20종류의 아미노산과 수천 종류의 단백질을 어떻게 네 개의 뉴클레오티드만을 가지고 번역하는가 하는 의문이 들지도 모른다. 그러나 이것은 어려운 일이 아니며 단지 코드화의 문제일 뿐이다. 점과 줄만으로 된 모스 부호로 소설 “리어왕”의 내용을 알파벳으로 써내려가는 것을 생각해 보면 뉴클레오티드로 암호화하는 방법에 대한 힌트를 얻을 수 있을 것이다. 모스 부호에서 ...과 ---이 알파벳의 “S"와 ”O"를 나타내는 것처럼, 유전자의 코드도 세 개가 하나로 되어 있다. 즉, 세 개의 염기로 연결된 뉴클레오티드가 한 아미노산의 코드가 되는 것이다. 예를 들어 글라이신은 GGA의 순서를 가진 뉴클레오티드로 코드화되어 있다. [참고; 염색체를 생각해 보자. 각 염색체는 40퍼센트가 DNA로 되어 있는데 아주 긴 이중나선이 단백질로 구성된 중심체에 끊어지지 않은 채로 단단하게 감기고 말려 있다. 인간의 한 염색체에 있는 DNA에는 약 6억 개의 뉴클레오티드가 들어 있어 천문학적 수의 염기 서열을 가지고 있다. 한 염색체에서 DNA 가작을 꺼내 쭉 펴놓으면 약 5센티미터의 길이가 된다. 또 인간의 한 세포에는 46개의 염색체가 있는데 여기에 들어 있는 모든 DNA의 길이를 합치면 2미터가 넘는다. 인체의 모든 세포를 생각해 보면 얼마나 많은 DNA가 들어 있는지 상상하기 힘들 것이다. 무려 지구에서 태양까지를 500회나 왕복할 수 있는 길이가 된다고 하니 정말로 짐 꾸리기의 전문가라고 할 수 있을 것이다.] 이 세 개로 이루어진 뉴클레오티드 한 벌을 가리켜 코돈 (codon)이라고 부른다. 네 종류의 뉴클레오티드로 이 코돈을 만들 수 있는 64가지가 되므로 (4*4*4=64) 20종의 아미노산을 만들고도 충분히 남는다. (사실 대부분의 아미노산은 한 개 이상의 코돈으로 코돈화된다.) 1967년에 코라나와 니런버그는 64개의 코돈이 각각 어떤 아미노산을 만드는가 하는 유전자 코드를 완전히 해독하였다. 그들의 연구에 의하여 코돈과 아미노산의 관계에 관한 해독표를 만들 수 있게 되었다. 이 코드는 모든 생물체에 동일하게 적용될 수 있는 것이다. 앞에서 유전자를 “단백질을 만드는 명령”이라고 했다. 이제 이를 좀더 자세하게 정의하면 “유전자는 고유한 뉴클레오티드 순서를 가진 DNA의 한 단편으로서, 아미노산을 조합하여 단백질을 만드는 정보를 코드화한 것”이라고 할 수 있다. [참고 ; 생명공학을 향한 발자취(연도, 사건) - 1665년 - 훅이 세포를 설명하고 명명하였다. 1675년 - 레벤후크가 더 좋은 현미경을 개발하고 미생물, 박테리아, 정자세포를 발견하였다. 1839년 - 슐라이덴과 슈반이 세포설을 발표하였다. 1859년 - 다윈이 ‘종의 기원’을 발간하고 자연도태설을 확립하였다. 1866년 - 멘델이 ‘식물의 잡종에 관한 연구’를 발간하고 유전의 원리에 관해 윤곽을 잡았다. 1869년 - 미셔가 최초로 핵산의 화학 분석을 하였다. 1902년 - 개로드가 유전자는 단백질을 만드는 명령을 구성한다고 가설하였다. 1910년 - 모건이 유전자는 염색체에 있음을 확인하였다. 1928년 - 그리피스가 형질 전환 인자 (유전 물질)를 발견하였다. 1941년 - 비들과 테이텀이 하나의 유전자는 하나의 효소를 만들다고 하였다. 1944년 - 에이버리와 그의 연구원은 그리피스의 형질 전환 인자가 DNA임을 증명하였다. 1953년 - 왓슨과 크릭이 DNA의 이중나선 구조를 밝혔다. 1967년 - 코라나와 니런버그가 유전자 코드를 풀어냈다]
10. 유전자에서 단백질로 - 유전자의 역할은 단지 아미노산의 코드화뿐만이 아니다. 단백질을 만드는 것을 시작하고 멈추도록 지시하는 부분, 서로 겹치도록 하는 부분 등, 그 내용을 설명하자면 교과서 같은 복잡한 이야기를 피하기는 어렵다. 비록 유전자의 다른 기작에 관해 설명할 것이 아직도 많지만 분자생물학을 아해하는 데 더 자세한 설명이 필요하지는 않을 것이다. 이제부터 유전자와 단백질의 관계에 대해 우선 간단하게 설명하고자 한다. DNA는 유전 정보의 보관 장치일 뿐이므로 단백질을 실제로 만들지는 않는다. DNA는 명령자이다. DNA의 명령을 수행하는 일꾼은 DNA와 유사한 핵산인 RNA이다. DNA의 한 가닥에 나열되어 있는 뉴클레오티드의 서열, 즉 유전자의 안내에 따라 RNA는 하나씩 차례로 아미노산을 만들고 단백질을 조립한다. 단백질 분자는 유전자에 의해 두 단계로 만들어진다. 첫째는 유전자의 RNA 복제본을 만드는 단계이다. DNA의 원본으로부터 만들어진 RNA 복제본은 유전자와 짝을 이루는 뉴클레오티드의 서열을 갖게 된다. 다음 단계에서 RNA는 세포의 다른 부분으로 이동한다. 거기서 뉴클레오티드의 서열은 단백질을 만들기 위한 아미노산의 서열로 해석된다. 세포 내부의 작은 단백질 조립 공장은 그 기작에 있어 모든 생물체가 동일하다. 이런 점 때문에 유전공학자들이 유전 정보를 한 생물체에서 얻어 다른 것에 넣을 수도 있고 새로운 유전 정보를 작성할 수도 있는 것이다. 앞에서 DNA의 복제에 대한 설명은 언급했으므로(5.) 이제부터 RNA에서 단백질이 만들어지는 과정에 대해서 자세하게 설명하도록 하겠다.
11. mRNA의 발견 - 유전자에서 단백질의 합성 장소인 ribosome으로 정보를 전달하는 mRNA (messenger RNA)라는 개념은 왓슨과 크릭의 DNA 모델의 출간 후에 생기게 되었다. 1958년 크릭은 RNA가 유전 정보의 중간 전달자로써 작용한다고 주장하였다. 그는 가설을 하나 세웠는데 그 내용은 DNA는 진핵세포 내의 핵에 존재하고 반면 단백질은 세포질에서 합성된다는 것이었다. 이것은 한 장소에서 다른 장소로 정보를 전달해야만 뭔가가 반드시 존재해야 한다는 것을 의미한다. 크릭은 ribosome이 RNA를 가지고 있다는 것을 알아차리고, rRNA가 정보의 전달자라고 처음에 주장하였다. 그러나 rRNA는 ribosome의 내부 요소였으므로, 벗어날 수는 없는 것이었다, 그러므로 크릭의 가설은 rRNA를 가지고 있는 각각의 ribosome은 똑같은 종류의 단백질을 계속해서 생산해내야만 하는 것이었다. Francis Jacob과 그의 동료들은 messenger라고 불리우는 불안정한 RNA들을 번역하는 불특정 라이보좀에 관한 대안적인 가설을 제안하였다. 이 messenger는 독립적인 RNA로서 유전자에서 라이보좀으로 유전 정보를 전달하는 것이었다. 1961년에 Jacob은 시드니 브레너와 메튜 메젤슨과 같이 messenger (전달자) 가설을 증명하게 되었다. 이 연구에서는 T2 박테리오파지를 사용하였는데 이것은 허쉬와 체이스가 유전자는 DNA로 구성되어 있다는 것을 증명한 실험에서 사용한 균주였다. 즉 파지 T2가 E.coli (대장균)에 감염하였을 때에, 파지 단백질을 만들기 위하여 박테리아 단백질 생산으로부터 숙주를 뒤엎는 것이었다. 만약 크릭의 가설이 맞았다면, 파지 단백질 생산을 위한 교환은 파지에 특이적인 RNA가 붙어있는 새로운 라이보좀의 생산과 병행되어야만 할 것이다. 새로운 라이보좀을 예전 라이보좀과 구분하기 위해서 실험자들은 무거운 질소 동위원소(15N)와 탄소(13C)를 감염되지 않는 세포내에 있는 라이보좀에 표지를 달았다. 그리고 나서 그들은 파지 T2로 이들 세포에 감염시켰고, 동시에 가벼운 질소(14N)와 탄소(12C)를 포함한 배지에 옮겨 주었다. 어쨌든 간에 파지 감염 후에 만들어진 새로운 라이보좀은 가벼울 것이고 예전의, 무거운 라이보좀을 밀도 중력 원심분리기를 통해 분리될 것이다. 브레너와 동료들은 역시 역시 만들어진 파지 RNA를 태깅하기 위해 32P로 감염된 세포를 표지하였다. 그리고 나서 질문을 하였다. 과연 방사성으로 표지된 파지 RNA가 새로운 혹은 예전의 라이보좀과 결합을 할 것인지에 관해서 말이다. 결국 파지 RNA는 예전의 라이보좀에서 발견되었는데 이것의 rRNA는 감염이 시작되기 전에 만들어진 것이었다. 명확하게 이 예전의 rRNA는 파지의 유전 정보를 전달할 수는 없는 것이었고, 더 확장해서 말하자면 이것이 숙주의 유전정보를 전달하는 것이 아님을 뜻한다. 그러므로 라이보좀은 지속적인 것이라고 할 수 있다. 라이보좀이 만든 폴리펩타이드는 자신들과 결합하고 있는 mRNA에 의존적인 것이다. 이 관계는 CD 플레이어와 CD의 관계와 맞아 떨어지게 된다. 음악 (폴리펩타이드)은 CD (mRNA)에 의존적이지 라이보좀 (CD 플레이어)에 의존적인 것은 아니다. 다른 실험자들은 벌써 메신저에 대한 보다 좋은 후보자들을 동정하였다. 불안정한 RNA 클래스들은 라이보좀과 일시적으로 상호작용한다는 것이다. 더욱 흥미로운 것은 파지 T2에 감염된 세포에서 이들 RNA는 파지 DNA와 유사한 기본적인 구성을 가지고 있다는 점과 박테리아의 DNA와 RNA와는 전혀 다른 것이었다. 이것은 정확히 우리가 파지 메신저RNA를 기대하는 것과 같고 정화히 또 그것이 되는 것이다. 반면 숙주의 mRNA는 숙주의 rRNA와는 달리 숙주 DMNA와 비슷한 기본 조성을 가지게 된다.
12. Transcription (전사) - 전사는 DNA 복제에서와 마찬가지로 같은 염기 짝짓기를 따른다. DNA의 T, G, C, A는 RNA 산물에 있어서는 A, G, C, U와 짝을 이루게 된다. 이 염기 짝정렬 패턴은 RNA 전사물이 유전자의 충실한 복제품이라는 것을 증명한다. 확실히 전사와 같은 고도의 정확한 화학 반응은 그들 스스로 현저한 속도로 일어나는 것은 아니다. 이들 반응은 효소에 의해 촉매되어지기 때문이다. 전사를 이끄는 효소는 RNA polymerase라고 한다. 전사는 세 단계로 일어나는데 이들 단계를 개시 (initiation), 신장 (elongation), 종결 (termination)이라고 한다. 다음은 진핵세포에서가 아닌 박테리아에서의 세 단계를 간략하게 설명하겠다. 1) 개시 - 먼저 RNA 중합효소는 프로모터 (promoter)라고 하는 유전자의 윗부분에 놓여져 있는 부분을 인식한다. RNA 중합효소는 프로모터 부분에 강하게 결합하여 프로모터 내에서 DNA 가닥을 녹이고 분리시킨다. 최소한 12bp가 녹아서 벌어지게 된다. 다음으로 RNA 중합효소는 RNA 사슬을 만드는 것을 시작하게 되는 것이다. 기질로서, 또는 합성 차단자의 역할을 하면서 이 작업에 관여하는 것은 ribonucleoside triphosphate 4개가 필요하다. 처음으로 또는 개시 부분에 기질은 보통 퓨린 뉴클레오티드들이다. 처음 뉴클레오티드가 정해진 위치에 놓인 후, 처음 포스포다이에스터 결합을 RNA 사슬 내에서 형성하게 된다. 몇몇의 뉴클레오티드는 중합효소가 프로모터 부분을 떠나고 신장(elongation)이 시작되기 전에 합쳐질 수도 있다. 2) 신장 - 전사의 신장 기간에는 RNA 중합효소는 길이가 점점 증가하고 있는 RNA 사슬 내에서 5번에서 3번 방향으로 리보뉴클레오티드들의 결합을 유도한다. (RNA의 5번 끝에서 3번 끝 방향으로) 이 일을 수행할 때에, RNA 중합효소는 DNA 주형을 따라 이동하게 된다. 이 녹은 지역은 주형 DNA의 염기들을 노출하게 되는데 이것은 새로 들어오는 리보뉴클레오티드들의 염기들과 짝을 이룰 수 있게 된다. 전사 기계인 RNA 중합효소가 통과하자마자 두 가닥의 DNA 사슬은 서로 다시 감기게 되고 이중나선을 재형성한다. 이 점이 바로 전사와 DNA 복제와의 중요한 차이점이다. a) RNA 중합효소는 오직 전사 기간에 한 가닥의 RNA 사슬만을 만든다. 이것은 주어진 유전자 내의 오직 DNA 가닥 한 개만을 복제한다고 할 수 있다. (그러나 반대쪽의 사슬은 다른 유전자 내에서 전사될 수 있다.) 전사는 그러므로 asymmetrical (비대칭적)이라고 할 수 있다. 이것은 양쪽의 DNA 가닥이 모두 복제되는 반보존적 DNA 복제와의 차이점인 것이다. b) 전사 반응에서 DNA 풀림은 한계적이고 일시적이다. 오직 충분한 가닥 분리가 일어나야만 RNA 중합효소가 DNA 주형 가닥을 읽도록 허용된다, 그러나 DNA 복제에서는 두 개의 부모 DNA 가닥이 영구적으로 분리된다. 3) 종결 - 프로모터가 전사에 필요한 개시 신호를 제공해주면서, terminator라고 불리는 유전자 끝부분의 다른 지역은 신호 종결로 작용하게 된다. 종결부분은 RNA 중합효소와 상호작용하면서 RNA 산물과 DNA 주형과의 결합 상태를 느슨하게 만드는 역할을 한다, 결과 만들어진 RNA는 RNA 중합효소와 DNA가닥으로부터 분리되어지고, 전사는 끝나게 되는 것이다. 이 대류에 관하여 최종적이고 중요한 점이 있다. RNA 서열들은 보통 5번에서 3번 방향, 즉 왼쪽에서 오른쪽으로 읽혀진다. 이것은 분자생물학자들에게 자연스럽게 작용되어지는 것이라고 느낄 수가 있는데 왜냐하면 RNA는 5번에서 3번 방향으로 만들어지고 결국 뒤에서 언급할 것이지만 mRNA는 역시 5번에서 3번 방향으로 번역되어지기 때문이다. 그러므로 라이보좀은 5번에서 3번 방향으로 정보를 읽기 때문에 문장을 읽는 것처럼 5번에서 3번 방향으로 쓰는 것이 적합할 것이다. 역시 유전자들은 보통 전사가 왼쪽에서 오른쪽 방향으로 진행해 나가도록 쓰여진다. 이 한쪽 끝에서 다른 쪽 끝으로 가는 전사의 흐름은 upstream이라고 하는 용어를 야기하는데, 이는 전사 시작부분의 DNA를 언급한다. (유전자가 대류적으로 쓰여질 때 왼쪽 끝부분과 가까운 부분) 그러므로 우리는 프로모터의 상대적인 유전자의 윗부분에 대부분의 프로모터가 놓여져 있다고 하는 것이 옳을 것이다. 같은 전사 대류에서 우리는 유전자들이 보통 프로모터의 아랫부분 (downstream)에 놓여 있다고 말할 수 있다. 유전자들은 보통 윗부분에 있는 비주형 가닥과 같이 편리하게 쓰일 수 있다.
13. 번역 (translation) - 번역의 기작 역시 복잡하고 매혹적인 것이라고 할 수 있겠다. 번역의 자세한 것은 뒤에 설명할 것이며 지금부터 번역 기작에서 중요한 역할을 하는 라이보좀과 전송 (transfer) RNAdp 대해서 얘기해 보겠다. 1) 라이보좀 : 단백질 합성 기계 - 우리가 흔히 아는 대장균의 라이보좀은 두 개의 소단위체인 50S와 30S로 이루어진다는 것을 알 수 있다. 50S와 30S에서의 숫자는 침강계수 (sedimentation coefficient)를 의미한다. 이 침강계수는 초원심분리기 안에 이들 소단위체들을 넣었을 때에 침강하는 속도를 측정한 것이다. 더 큰 침강 계수를 가진 50S 소단위체는 초원심 분리기 안에서 밑바닥으로 더 빨리 이동한다. 즉, 계수는 입자의 질량과 모양의 기능이라고 할 수 있겠다. 무거운 입자는 가벼운 입자보다 더 빠른 속도로 침강한다. 그리고 구형의 입자는 확장적이고 편평한 입자보다 더 빨리 이동한다. 50S 소단위체는 실질적으로 30S 소단위체보다 두 배 정도 질량이 크다고 할 수 있다. 그리고 50S 소단위체와 30S 소단위체는 서로 맞물려 70S 라이보좀을 형성한다. 여기서 주의해야 할 점은 단지 숫자를 더해서 되는 것이 아니라는 것이다. (50+30=80이 아니다) 이것은 왜냐하면 침강계수는 입자의 질량과 비례하는 것이 아니라 질량 입자의 약 3분의 2 정도로 비례하기 때문이다. 각각의 라이보좀 소단위체는 RNA와 단백질을 포함하고 있다. 30S 입자는 16S의 침강계수를 가진 rRNA 한 분자와 21개의 라이보조멀 단백질을 가지고 있다. 반면 50S 입자는 2개의 rRNA(23S+5S)과 34개의 단백질로 구성되어 있다. 모든 라이보조멀 단백질들은 그들 스스로의 유전자 산물이라고 할 수 있기에 라이보좀은 서로 다른 유전자들에 의해 합성되어진다고 할 수 있다. 진핵 생물에서의 라이보좀은 하나의 rRNA를 더 가지고 있고, 수많은 단백질들을 가지고 있다는 점에서 더 복잡하다고 할 수 있다. rRNA는 단백질 합성에 참여하지만, 단백질들을 암호화하지 않는다는 점에 유의할 필요가 있다. 전사는 오직 rRNA에 대한 유전자 발현 단계일뿐인 것이다. rRNA의 번역은 일어나지 않는다. 2) tRNA (수용 분자) - 전사 기작은 분자생물학자들이 예측하기에는 쉬운 기작이다. RNA가 DNA와 매우 가깝게 닮아서 같은 염기 짝 규칙을 적용할 수 있기 때문이다. 이 규칙을 적용함으로써 RNA 중합효소는 자신이 전사한 유전자들의 복제품을 생산하는 것이다. 그러나 라이보좀의 mRNA에서 단백질로의 번역 기작에 적용되는 규칙은 무엇일까에 대해서 의문점을 가질 수 있게 된다. 핵산의 언어는 단백질 언어로 반드시 번역되어야만 한다. 크릭은 이 문제에 대한 해답을 1958년에 제안하였다. 크릭이 증명한 것은 어떤 종류의 수용 물체가 단백질 언어에서의 아미노산 뿐만 아니라 RNA 언어에서의 뉴클레오타이드들을 인식할 수 있다라고 생각한 것이다. 바로 이게 옳은 것이었다. 그는 크릭은 수용체의 역할을 할 수 있는 알려지지 않은 어떤 유형의 작은 RNA를 지적하였다. 다시 그의 추측은 옳았었다. 번역 과정에서의 수용체 분자는 RNA와 아미노산 양쪽을 모두 인식할 수 있는 작은 RNA 분자였고, 이것이 바로 전송 RNA (tRNA)이니 것이다. tRNA의 구조를 보면 클로버잎 모양의 구조를 띄게 되는데 이 분자는 2개의 중요한 말단 부분을 가진다는 것을 알 수 있다. 한 쪽 말단은 아미노산이 붙을 수 있는 부분이다. 만약 페닐알라닌에 특이적인 tRNA라면 이 부분에 페닐알라닌만이 붙을 수 있다. 페닐알라닌 tRNA 합성효소라고 불리는 효소가 바로 이 반응을 촉매한다고 볼 수 있다. 이렇게 이러한 작용을 하는 효소들을 일반적으로 아미노산 tRNA 합성효소라고 한다. 반면 다른 한 쪽 끝은 3bp의 서열을 가지고 있는데 이것은 mRNA의 3bp와 상보적으로 짝을 지을 수 있는 부분이다. 이러한 mRNA의 3bp의 서열을 코돈이라고 부른다. 그리고 tRNA에서의 상보적인 서열을 자연적으로 앤티코돈이라고 부른다. mRNA의 코돈이 이와 상보적인 서열을 가지고 있는 tRNA의 앤티코돈과 서로 작용하게 되는 것이다. 즉 코돈은 라이보좀이 자라나는 폴리펩타이드 안으로 아미노산을 끼워 넣을 수 있도록 지시하는 셈이 된다. 코돈과 앤티코돈 사이의 인식은 라이보좀에 의해 조절되어지는데 이것은 왓슨과 크릭의 규칙과 같이 명령되어진다. 즉, 어떤 두 가작의 폴리뉴클레외드에서처럼 말이다. 하지만 단백질의 경우 처음 두 개의 염기 쩍정렬의 경우에서만 적용되어지고 나머지 세 번째 염기는 자유로이 짝을 지을 수 있다. 이상 간략하게 살펴보았는데 페닐알라닌의 경우를 예로 들어 보면, 페닐알라닌에 대한 코돈은 UUG가 된다. 이것은 세 개의 철자를 포함하는 유전자 코드임을 암시한다. 여기서 3bp의 코돈의 가능한 가짓수를 예측할 수 있다. 염기는 4종류로 구성되어 있으므로 3개의 코돈을 만들 수 있는 가짓수는 4*4*4=64개라는 것을 예측 가능하다. 하지만 현재 이 세상에는 20가지의 아미노산이 존재한다. 그러면 몇몇 코돈은 사용되어지지 않는 것일까? 사실, UAG, UGA, UAA 코돈들은 종결에 사용되어지는 것들이다. 즉 라이보좀에게 단백질 합성을 중지하라는 신호를 전달해 주는 역할을 한다. 이 3가지 외에 모든 다른 코돈들은 아미노산을 암호화한다. 이것은 대부분의 아미노산이 한 개 이상의 코돈을 가지고 있다는 것을 의미한다. 따라서 유전자 코드는 degenerate(축중한, 퇴화한) 하다고 할 수 있다. 3) 단백질 합성의 개시 - 우리는 세 개의 번역을 종결하는 코돈에 대해서 알아 보았다. AUG라는 코돈은 역시 보통 번역을 개시한다. 번역의 종결과 개시는 확실히 다른 것이다. 즉, 세 개의 종결 코드는 단백질 factor와 상호결합하는 반면 개시 코돈은 특정의 아미노산-tRNA와 상호작용한다. 진핵생물에서의 아미노산-tRNA는 메싸이오닐 tRNA (tRNA에 메싸이오닌이 결합한 것)인 반면 원핵생물에서는 N-포밀메싸이오닐 tRNA로서 메싸이오닌의 아미노 그룹에 포밀 그룹이 붙은 메싸이오닐 tRNA인 것이다. 우리는 AUG 코돈이 mRNA의 처음 부분에서 뿐만 아니라, 메시지의 중간부분에 도 있다는 것을 알았다. AUG들은 개시 코돈으로서도 작용하지만, 서열의 중간부분에 있을 때에는 단지 메싸이오닌 아미노산을 암호화하는 것이다. 이 차이점은 다음과 같이 설명할 수 있다. 원핵세포에서의 메시지는 Shine-Dalgarno 서열이라고 부리우는 특정한 염기 서열을 가지고 있는데, 이것은 AUG 개시 코돈의 바로 윗부분에 존재한다. Shine-Dalgarno 서열은 AUG 근처로 라이보좀들을 RMf여 들여 번역 과정을 시작할 수 있는 것이다. 반면 진핵세포에서는 Shine-Dalgarno 서열을 가지고 있지 않다. 대신 진핵세포에서의 mRNA는 5번 말단 부분에 cap이라고 불리우는 특정한 메틸화된 뉴클레오타이드를 가지고 있다. CBP (cap binding protein)이라고 불리우는 단백질이 cap에 결합을 하게 되고 라이보좀을 이끌어 오는 역할을 하게 된다. 4) 번역 신장 - 번역의 개시 단계 마지막 부분에서는 개시하는 아미노산-tRNA가 라이보좀의 P site에 결합을 하게 된다. 신장이 일어나기 위해서는 라이보좀은 한 번에 하나씩 개시하고 있는 아미노산에 아미노산들을 붙이는 것을 필요로 한다. 예를 들어 E.coli에서의 신장 단계를 살펴 보기로 한다. 신장은 라이보좀의 또 다른 부분인 A-site에 두 번째 아미노산 tRNA기 결합함으로써 시작된다. 이 과정은 EF-Tu라고 불리우는 신장 요소를 필요로 한다. 여기서 EF는 elongation factor를 의미하고 GTP에 의해 제공된 에너지라고 할 수 있다. 다음으로 두 개의 아미노산 사이에는 반드시 펩타이드 결합이 형성되어야만 한다. 큰 라이보조멀 소단위체는 peptidyl transferase라고 불리우는 효소를 가지고 있는데 이것은 아미노산 사이나 P site에서의 펩타이드와 A site에서의 아미노산-tRNA의 아미노산 부분사이의 펩타이드 결합을 형성한다. 결과 A site에서의 dipeptidyl-tRNA가 생기게 된다. dipeptide는 대장균의 경우 fMet와 아직 tRNA에 결합하고 있는 두 번 째 아미노산으로 구성되어진다. 큰 라이보조멀 RNA는 peptidyl transferase 활성 장소를 가지고 있다. 신장의 세 번재 단계인 translocation (전좌, 전위)는 라이보좀을 따라 mRNA가 한 코돈의 길이로 이동하는 것을 내포한다. 이것은 A site에 있던 dipeptidyl-tRNA가 P site로 이동하게 되는 것이고 P site에 있던 탈아세틸화된 tRNA가 E site로 이동하는 것을 의미한다. E site는 라이보좀으로부터 방출되어지는 곳이라고 생각하면 될 것이다. 전위는 EF-G라고 불리우는 또 다른 신장 요소와 GTP를 필요로 한다. 5) 번역의 종결과 mRNA의 구조 - 세 개의 서로 다른 코돈 (UAG, UAA, UGA)는 번역의 종결을 유발한다. release factor라고 불리우는 단백질 요소는 이들 종결 코돈 (또는 정지 코돈)을 인식하고 폴리펩타이드들의 방출과 더불어 번역을 종결하는 것이다. 유전자의 암호화되는 지역의 한쪽 말단에서의 개시 코돈과 또 다른 말단에서의 종결 코돈은 ORF (open reading frame)를 동정한다. ORF가 open이라고 불리우는 이유는 ORF는 상응하는 mRNA의 종결을 방해하는 내부 종결 코돈을 중간에 가지고 있지 않기 때문이다. Reading frame이라는 이름은 라이보좀이 세 가지의 다른 방법으로 mRNA를 읽을 수 있다는 점, 또는 라이보좀이 번역을 시작하는 곳에 의존하여 “frame"이라는 이름을 얻게 된 것이다. ORF는 아주 작은 유전자로서 개시 코돈과 종결 코돈을 포함한다. 여기서 이들 DNA 코돈들은 이와 상응하는 코돈을 가지는 mRNA로 전사되어진다는 것을 명심해야 한다. 그리고 번역 과정이 이루어지게 되는데 여기서 또 주의해야 할 점은 ORF의 끝부분인 종결 코돈 부분은 번역되어지지 않는 것이다. 즉 전사과정은 종결 코돈까지 진행이 되어 mRNA를 만들지만, 번역과정에서는 종결 신호로 작용하여 더 이상의 아미노산을 합성하지는 않는 것이다. 정리해 보면 전사와 번역 과정은 같은 장소에서 개시, 종결되어지는 것은 아니다. 전사는 ORF의 앞부분에서 시작하지만, 번역은 전사 시작보다 아래 부분인 개시 코돈 (AUG)로부터 시작된다. 그러므로 유전자로부터 생성된 mRNA는 앞부분에 leader 혹은 5‘-UTR (5'-untranslated region)이라고 불리우는 부분을 갖게 되는 것이다. 유사한 방법으로 ORF의 종결 코돈과 전사 종결 부분 사이에서는 trailer 또는 3’-UTR (3'-untranslated region)이라는 부분이 생기게 된다. 진핵 생물의 유전자에서는 전사 종결 부분은 아마도 훨씬 밑에 부분에 존재할지도 모른다. 즉, mRNA는 번역 종결 코돈의 아랫 부분 (downstream)을 잘릴 것이고, poly A가 mRNA의 3번 말단 부분에 첨가되어질 것이다. 이 경우에 trailer는 종결 코돈과 poly A 사이에 있는 RNA의 길이가 될 것이다.
14. 원핵생물과 진핵생물 - 이상 central dogma의 기본 원리인 DNA 복제, 전사, 번역에 대해서 자세하게 알아 보았다. 이들 세 가지 과정은 모든 세포 생물체에서 일어나는 과정이다. 하지만, 원핵생물과 진핵생물 사이에서는 이 3가지 과정의 차이점이 존재한다. 이것은 유전정보의 조직에서의 차이점에서 기인된 것인데, 바로 진핵생물은 핵 (nucleus)을 가지고 있기 때문이다. 원핵생물과 진핵생물에서의 DNA 구성에는 기본적인 차이점이 있다. 요약해 보자면, 전형적인 원핵생물의 유전체는 하나의 닫혀진 환형 DNA 분자로서 세포 내의 세포질 상에 존재한다. 그리고 진핵생물의 유전체는 몇몇의 일렬로 된 (linear) DNA 조각들로 세포내의 핵 안의 각각의 염색체 안에 존재하게 된다. 원핵생물에서는 세포질로부터 염색체를 구분하는 막이 존재하지 않는다. 그러나 진핵생물에서는 염색체가 핵 안에 존재하고 세포질 상에 라이보좀이 있어, 전사와 번역이 공간적으로 구분된 장소에서 일어나게 된다. (전사는 핵 안에서 일어나고, 번역은 세포질 상에서 일어난다.) 모든 종류의 세포에서 유전자의 정의는 같다. 단백질을 특이화하는 DNA 조각, tRNA, rRNA 용어들을 보면 말이다. 하지만 진핵생물에서는 단백질을 암호화하는 유전자들이 둘 또는 그 이상의 암호화 지역으로 쪼개짐에 따라, 암호화하는 부분과 암호화하지 않는 부분은 구분되어지는 것이다. 이렇게 암호화하는 서열을 엑손이라 부르고 암호화하지 않는 서열을 인트론이라고 한다. 인트론과 엑손 모두 primary 전사물 또는 pre-mRNA로 전사되어지고 기능적인 즉, 기능을 가진 mRNA는 암호화하지 않는 부분을 제거함으로써 형성되어진다. 진핵생물에서 pre-mRNA에서 암호화되지 않는 부분을 잘라내는 과정을 splicing이라고 한다. 이것은 pre-mRNA가 mature mRNA로 가능하게 함으로써 기능을 갖도록 하는 것이다.
15. Central dogma의 예외 - 지금까지 분자생물학에서 사용되는 중요한 원리인 central dogma에 대해서 알아 보았다. 한 마디로 정의하면 DNA는 복제를 위해 스스로 주형이 되고, DNA로부터 RNA가 전사되며, RNA는 단백질로 번역된다는 것이다. 하지만 central dogma는 때로 오해를 불러 일으킬 수 있는데, 이는 DNA에서 RNA, 그리고 단백질로의 정보 흐름의 표준이 때때로 혼동을 일으킬 수 있기 때문이다. 사실 정보 흐름의 표준에 위배하는 몇 가지의 예외가 존재한다. 그 예로는 먼저 reverse transcription (역전사)이 있다. RNA를 유전 정보 전달 물질로 가지는 바이러스 등에서 발견되는 것으로 RNA를 주형으로 해서 DNA를 만드는 것이다. 여기서 작용하는 효소는 reverse transcriptase (역전사 효소)이다. 즉, DNA에서 RNA가 아닌, RNA에서 DNA로의 유전 정보 전달이 이루어지는 것은 명백히 central dogma에 위배된다고 할 수 있다. 다음은 prion의 발견이다. 이 단백질은 DNA나 RNA를 거치지 않고 단백질 수준에서 복제를 하기 때문에 이것도 central dogma에 위배되는 좋은 예라고 할 수 있다. Prion이 일으키는 대표적인 질병으로는 광우병을 들 수 있다.
*** Reference ***
1. 서적
- Molecular Biology 2nd edition (McGraw Hill 출판, Robert F.Weaver 저)
ch2. The Molecular Nature of Genes
ch3. Strong Information
- Brock Biology of Microorganisms 10th edition (Prentice Hall 출판, Michael T.Madigan 외 2명 저)
ch7. Principles of Microbial Molecular Biology
- 생명공학이란 무엇인가? 그 약속과 실제 (지성사 출판)
p21~p50
2. 인터넷
- Central dogma of molecular biology - Wikipedia, the free encyclopedia
주소 -> http://en.wikipedia.org/wiki/Central_dogma_of_genetics
- Access Excellence ; the nation health museum resource center
주소 -> http://www.accessexcellence.org/RC/VL/GG/central.html