왜 DNA는 설계도, 단백질은 일꾼이 됐을까

한겨레 2023. 8. 23. 11:05
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[주철현의 커넥션][주철현의 커넥션]
(11) 생명의 중심 원리
두 가닥의 DNA는 서로 꽉 물린 지퍼처럼 ‘이중 나선’으로 존재한다. 위키미디어 코먼스

이전 칼럼에서는 생명의 유전자를 분류한 생명의 나무를 거슬러 올라가면 ‘루카’(LUCA=Last Universal Common Ancestor)라는 생명의 뿌리에 도달한다는 것을 알아보았다. 루카는 ‘최후의 보편적 공통 조상’ 정도로 해석된다. 그런데 최후(last)라는 형용사에 고개가 갸웃거려 진다. 왜 최초가 아니라 최후일까? 이번 시간에는 생명을 지배하는 중심 원리(central dogma)를 통해 최후라는 형용사의 의미를 알아보자.

일반적으로 단백질이라고 하면 헬스 보충제나 필수 영양소를 떠올리지만, 진정한 정체는 생명의 일꾼이다. 모든 생명 현상의 구현은 단백질의 몫이다. 유전자가 복제되는 것도, 정자와 난자가 만나는 것도, 수정란이 분열해 태아로 발달하는 것도, 심장이 뛰어 혈액을 밀어내는 것도, 몸을 지탱하기 위해 뼈를 만드는 것도, 팔다리의 근육이 움직여 달리는 것도, 바이러스를 제거하기 위해 항체를 만드는 것도, 이 글을 읽으며 두뇌에 전기 신호가 흐르는 것도, 모두 단백질 상호 작용의 결과물이다.

단백질은 분자생물학의 영역이다. 자연 과학은 연구 대상의 크기로도 나눌 수 있다. 물리학은 기본입자에서 원자까지, 화학은 원자에서 분자까지, 생물학은 분자에서 생물까지가 주요 대상이다. 단 생물학에서는 ‘특별한’ 분자들만 다룬다. 모든 분자를 다루는 일반 화학에서, 탄소가 포함된 분자를 다루는 유기화학, 생명 구성 분자를 다루는 생화학을 거치면서 대상이 점점 구체화된다. 분자생물학은 생화학과 생물학 사이에 걸쳐 있으며 DNA, RNA, 단백질이라는 정말 ‘특별한’ 분자들이 연구 대상이다.

뜬금없이 학문 체계를 설명한 이유는 단백질, 그리고 나아가 생명 현상은 상위의 물리 법칙을 벗어날 수 없다는 것을 확인하기 위해서다. 하지만 이것이 생명 현상을 단순한 원리로 설명할 수 있다는 환원주의로 연결되면 곤란하다. 물리-화학-생물로 가면서 가능한 요소들의 연결과 상호 작용은 천문학적 수준으로 늘어난다. 이것이 이 칼럼의 큰 주제인 연결의 조합이 만들어내는 복잡계의 창발 현상이다.

하지만 반대로 생물-화학-물리의 방향으로 역주행해서 생명 현상을 단순화하는 것은 불가능할 뿐더러 위험하기까지 하다. 엉터리 환원주의가 만들어낸 괴물이 바로 나치 우생학이다. 이에 대해서는 나중에 기회가 되면 더 다루고, 중요한 점은 아무리 복잡하고 신기한 생명 현상이라도 근원적인 물리 법칙을 위배할 수 없다는 것이다.

단백질도 엄연한 물체이기에 그 기능은 물리 화학적 상호 작용으로 구현된다. 시공간에서 어떤 동작이 일어난다는 것은, 공간을 채우는 구조가 시간의 흐름에 따라 변화한다는 의미다. 예를 들어 손목시계는 태엽에 저장된 에너지를 바늘의 일정한 움직임으로 변환시킨다. 시계 속의 톱니바퀴는 정해진 구조를 가지고 정해진 공간을 채우고 있다. 이 구조들이 상호 작용을 하면 바늘이 일정한 속도로 움직인다. 이때 각 톱니바퀴를 하나의 단백질이라 생각하면 된다. 즉 단백질의 기능은 구조와 동일한 개념이다.

단백질 접힘이 일어나기 전과 후의 구조 비교. 위키미디어 코먼스

단백질 구조를 결정하는 ‘접힘’

시계를 만들기 위해서는 필요한 톱니바퀴들을 설계하고, 이를 바탕으로 금속을 깎아서 만든다. 그런데 우리 세포 속에 이런 설계자와 공작 시설이 있을 리가 없다. 그럼 단백질의 구조는 어떻게 만들어질까? 이를 이해하기 위해서는 접힘(folding)이라는 과정을 알아야 한다. 정해진 종류의 단위 분자가 반복적으로 연결된 긴 사슬 형태의 분자를 중합체라 한다. 그리고 덩어리가 크면 고분자라 한다. 단백질은 아미노산이라는 단위 분자가 길게 연결된 고분자 중합체다. 다양한 구슬을 꿰어서 만든 목걸이와 유사하다.

그런데 2차원 구조의 긴 목걸이가 어떻게 3차원을 채우는 덩어리가 될까? 그 비밀은 구슬, 즉 아미노산들의 크기와 물리적, 화학적 특성이 다양하다는 것에 있다. 물이라는 극성을 가진 용매 속에서 아미노산들은 서로 밀치거나 당기는 특성을 가지게 된다. 그럼 아미노산들의 상호 작용에 의해 긴 사슬은 저절로 접히고 꼬여 덩어리 모양이 된다. 쓰지 않는 케이블들을 서랍에 넣어두면 저절로 꼬이고 엉켜 덩어리가 되는 것과 마찬가지다. 물론 아무렇게나 꼬이면 의미가 없다. 특정한 조건(온도, 이온 등)의 수용액 속에서는 동일한 아미노산 연결 순서를 가진 단백질은 항상 동일한 구조로 접히게 된다. 이것이 아미노산의 연결 순서가 단백질의 구조를 결정하는 접힘 과정이다.

우주에서 지구, 거기서도 지극히 좁은 온도 범위에서만 생명체의 존재가 가능한 이유가 단백질 접힘의 온도 제약 때문이다. 허용된 범위를 벗어나면 엉뚱한 구조의 단백질이 만들어진다. 그나마 만들어진 단백질도 다른 단백질과 상호 작용이 엉망이 된다. 고등 동물일수록 체온을 일정하게 유지하는 능력을 가지고 있다. 정교한 생물학적 현상일수록 정밀한 단백질 구조가 필요한데, 이는 작은 온도 변화에도 쉽게 망가지기 때문이다. 너무 춥거나 더우면 머리부터 제대로 돌아가지 않고 헛소리가 나오는 것은 지극히 정상이다. 

톱니바퀴들이 맞물려 기계를 작동시키듯 생명도 단백질이 정교하게 상호작용하는 구조체다. 픽사베이

DNA와 단백질, 어떻게 다른가

단백질 접힘이 일정하게 이루어진다는 전제 조건이 확보되면, 기능 즉 구조는 아미노산의 연결 순서가 결정하게 된다. 이 순서가 생명 정보이며, 어딘가에 잘 보관되어 있어야 한다. 이 소중한 정보가 저장되는 데이터베이스가 DNA다. 단백질과 DNA는 모두 고분자 중합체지만 차이점이 있다. 단백질 사슬은 한 가닥, DNA 사슬은 두 가닥이다. 그리고 단백질을 만드는 구슬(분자)은 아미노산 20 종류, DNA를 만드는 구슬(분자)은 핵산 4 종류다. 이 차이가 구조(단백질) 혹은 정보(DNA)에 적합한 특성을 만들어낸다.

DNA의 핵산은 A, T, C, G라는 약자로 표시한다. 그리고 분자 구조의 전자기력 분포로 인해 A는 T와, C는 G와 결합한다. 마치 자석의 N극과 S극이 서로 당기는 것 같은 현상인데, 이를 상보성(complementarity)이라 한다. 서로 상보성이 있는 두 가닥의 DNA는 서로 꽉 물린 지퍼처럼 ‘이중 나선’으로 존재한다. 이는 아주 안정적 구조로, 사슬의 결합이 모두 끊어지는데 이론적으로 최대 150만년이 걸린다. 가끔 수십만년 동안 땅속에 묻혀 있던 멸종한 생물의 뼈에서 DNA를 추출하여 서열을 확인하고, 진화 과정을 분석한 결과가 보도된다. 이것이 DNA의 안정성을 잘 보여주는 예이다. 상보성은 안정성에만 도움을 주는 것은 아니다. DNA가 복제되고 단백질로 만들어지는 과정도 모두 이 상보성에 의존한다. 이에 대해서는 설명할 내용이 많으므로 다음 칼럼에서 따로 다루기로 하자.

지금까지 내용을 정리하면 생명 활동은 단백질의 구조에 의해 구현되고, 구조 정보는 DNA에 보관되어 있다. DNA에 기록된 2차원 서열(아미노산 순서)이 단백질로 만들어질 때 환경 조건이 만족되면, ‘접힘’이라는 과정을 통해 정해진 구조를 가지게 된다. 이 구조는 특정한 생명 기능을 수행한다. 줄여서 말하면 DNA는 설계도, 단백질은 일꾼이다. 이 연결 관계를 기술한 것이 바로 “유전자가 단백질을 만든다”는 생명의 중심원리다.

단백질을 구성하는 아미노산 정보는 3개의 핵산이 하나로 묶인 ‘코돈’(codon)에 저장돼 있다. 미 국립보건원 인간게놈연구소

왜 핵산은 4가지, 아미노산은 20가지만 쓸까

칼럼에서 자주 나오는 발현(expression)이라는 용어는 생명 정보가 기능으로 구현되는 현상을 말한다. 생명의 중심 원리는 이 발현의 방향을 정의한다. 단백질의 아미노산 서열이 DNA의 핵산 서열로 변환되는 역발현은 불가능하다. 그런 기전이 지구상에 존재하지 않기 때문이다. 그런데 지구상의 모든 생물들은 왜 DNA에서 단백질을 만들까? 생명의 중심 원리 주변에는 이런 의문스러운 점이 아주 많다.

생명이 이용하는 핵산은 4가지, 아미노산은 20가지라고 했다. 따라서 핵산 하나로는 아미노산 정보를 제대로 저장할 수 없다. 연속된 핵산 두개를 묶어서 정보를 나타내어도 4 x 4, 즉 16개의 아미노산만 표시할 수 있다. 결국 연속된 핵산을 최소한 세 개를 묶어야, 20개 아미노산 정보를 제대로 저장할 수 있다. 실제 생물의 DNA는 핵산 3개씩 묶어 아미노산 정보를 저장하고 있는데 이를 코돈(codon)이라 한다. 지구상의 모든 생명은 이 코돈 체계를 공유한다. 세균이나 사람이나 코돈은 동일하다는 말이다. 왜 이럴까?

코돈에는 4 x 4 x 4 = 64개의 정보를 담을 수 있다. 그런데 아미노산 정보 저장에 필요한 것은, 단백질 합성을 멈추는 마침표 역할을 하는 코드 하나를 포함해, 21개의 코드만 있으면 된다. 따라서 생명이 이용하는 코돈에는 43개의 코드가 남는다. 이 때문에 남는 코드들은 하나의 아미노산에 중복 지정되어 있다. 따져보면 코돈은 정보 저장 효율은 50%도 안 되는 엄청난 비효율적 체계인 것이다. 만약 아미노산이 20종이 아니라 15종만 사용된다면, 2개 단위의 코돈이 아미노산 정보와 딱 떨어져 정보 저장 효율이 100%가 되었을 것이다. 반대로 64가지 아미노산을 지정할 수 있는데도 20개의 아미노산만 사용하는 것도 이상하다. 생화학적으로 아미노산은 엄청나게 많은 종류가 존재 가능하다. 실제 다른 용도로 사용되는 다른 종류의 아미노산들도 생채에 존재한다. 하지만 지구상의 모든 생명체는 오직 스무 가지의 아미노산만 단백질을 만드는데 이용한다. 왜 이럴까?

DNA를 구성하는 네 가지 기본 핵산도 마찬가지다. 기본 핵산이 아닌 인공적으로 합성된 핵산은 항암제나 항바이러스제로 이용되기도 하는데, 이 엉뚱한 핵산들이 유전자 복제 위치에 존재하면 DNA가 망가져 버리기 때문이다. 존재 가능한 핵산의 종류는 다양함에도 불구하고, 생명은 오직 네 가지의 핵산만 정보 저장에 이용한다. 왜 이럴까?

생물학의 상위인 화학적 관점에서 살펴봐도 의문점은 이어진다. 네 개의 결합 가지를 가진 아미노산의 화학 구조는 거울상인 L 과 D 형태가 가능하다. 그런데 지구상 모든 생물은 오직 L 형태의 아미노산들만 이용한다. 왜 이럴까?

대사의 에너지원인 탄수화물도 역시 두 거울상 형태를 가질 수 있다. 그리고 가장 단순한 탄수화물인 포도당은 생체의 가솔린 같은 존재다. 그런데 생물은 D형 포도당만 이용한다. 이건 또 왜 이럴까?

현존하는 모든 생물이 하나의 공통 조상에서 파생된 결과물이라는 생명의 중심 원리는 ‘오캄의 칼날’ 논리로 설명할 수 있다. 어떤 현상에 대한 여러 설명이 존재할 경우, 불확실한 가정이 가장 적은 것이 정답이라는 논리다. 브리태니커

‘하나의 공통 조상’을 전제해야 설명 가능

이 수많은 의문들은 ‘오컴의 칼날’(Occam’s razor)로 해결된다. 이는 어떤 현상에 대한 여러 설명이 존재하면, 불확실한 가정이 가장 적은 것이 정답이라는 논리 접근법이다. 중세의 유명한 신학자 이름에서 따온 방법론인데 철학에서 과학까지 널리 사용되고 있다. 쉽게 설명하면 ‘가장 간단한 것이 정답’이라는 것이다. 물론 비교는 같은 수준에서 이루어져야 한다. 형이상학적 설명과 형이하학적 설명을 비교할 수는 없다. 형이상학적 설명이 항상 더 간단하기 때문이다.

오컴의 칼날이 다듬어 낸 루카(LUCA)의 의미는 다음과 같다. 생명의 중심 원리가 지배하고, 생명이 이용하는 고분자의 종류와 개수가 정해져 있는 것은, 현존하는 모든 생물이 하나의 공통 조상에서 파생된 결과물이기 때문이다.

지구 생태계에서는 루카에서 파생되어 나온 수많은 생물들이 각자의 유전자를 영속시키기 위한 진화라는 게임을 40억년 동안 벌이고 있다. 존재하고 존재했던 모든 생명체들이 참여하는 이 거대한 게임은 생명의 중심 원리가 지배한다. 이 간단한 규칙의 게임은 인간이 만든 어떤 정교하고 복잡한 규칙의 게임보다 공정하다. 어기면 죽음이기 때문이다. 규칙을 강력하게 만드는 것은 적용의 절대성이다.

예를 들어 ‘악플은 사형’이라는 무시무시한 규칙이 있다고 하자. 이 엉터리 규칙이 말이 되는지 상관없이 ‘무조건’ 적용한다면 어떻게 될까? 찾아가서 주먹질은 하더라도 악플은 영원히 사라질 것이다. 반대로 아무리 복잡하고 정교한 규칙을 가진 스포츠라도 심판이 엉망이면 게임도 엉망이 된다.

현존하는 모든 생물은 하나의 공통 조상에서 시작됐음을 보여주는 생물 분류도. 맨 가운데 있는 것이 공통조상 루카(LUCA)다. 위키미디어 코먼스

루카, 생명 초기 경쟁에서 살아남은 최후의 승자

생명의 중심 원리로 세포 수준의 대사와 복제에서 세대를 관통하는 종의 진화까지 생태계에서 관찰되는 모든 현상에 대한 설명이 가능하다. 그런데 이를 법칙(principle)이 아니라 원리(dogma)라고 하는 이유에 대한 설명도 필요하다. 해석은 원리로 되었지만, 도그마(dogma)라는 단어는 특정 학문 영역(domain)내에서만 통하는 원리를 의미한다. 생물학의 상위인 물리나 화학적 관점에서 생명의 중심 원리가 존재해야 할 이유는 없다. 지구의 생물이 아니라면 단백질이 유전자를 만들어도 상관없다. 단백질이 유전 정보를 보관하는 유전 물질이 되어도 상관없다. 이 넓은 우주 어딘가에는 단백질 정보를 DNA로 변환시켜 불로장생이 가능한 외계 생물이 존재할 수도 있다. 하지만 ‘지구 생태계’에 현존하는 생물이라면, 루카에서 기원한 생명의 중심 원리는 절대적이다.

하지만 루카는 초기 원시 지구에서 어떻게 생명의 최소 단위인 세포가 탄생하였는지는 설명하지 못한다. 그 이전은 가설과 추측의 영역이다. 현대 물리학의 빅뱅 이론은 빅뱅 자체를 설명하지 못한다. 하지만 빅뱅을 제외한 우주의 모든 현상을 설명할 수 있는 이론이다. 여기서 설명이라 함은 우리가 지금까지 측정한 우주의 모든 현상에 대한 객관적 데이터를 해석할 수 있다는 것이다. 이와 유사하게 루카는 생명의 탄생을 제외한 현재 생명의 모든 현상을 설명한다. 빅뱅 이전을 설명할 수 없다고 빅뱅 이론이 틀렸다고 말하는 과학자는 없다. 마찬가지로 생명 탄생을 설명할 수 없다고 루카가 틀렸다고 말하는 과학자도 없다.

빅뱅이 관찰 가능한 우주의 특이점인 것처럼 루카 역시 관찰 가능한 생물 진화의 특이점인 셈이다. 여기서 우리가 분명히 알 수 있는 것은 초기 생명의 원형들이 벌인 치열한 생존 경쟁에서 살아남은 최후의 승자가 루카라는 것이다. 이제 처음 언급한 대로 왜 최후(last)라는 단어가 생명의 공통 조상세포를 수식하고 있는지 이해가 될 것이다.

다음 칼럼에서 중요한 생체 고분자 중합체 중에서 설명하지 않았던 RNA에 대해 알아볼 것이다. LUCA 이전에 존재했을 것으로 추정되는 RNA 세상(RNA world)에 대한 이야기다.

주철현/울산의대 미생물학 교수·의학교육센터장

Copyright © 한겨레신문사 All Rights Reserved. 무단 전재, 재배포, AI 학습 및 활용 금지

이 기사에 대해 어떻게 생각하시나요?