[강석기의 과학카페] 헬렌 버먼, 2024 노벨화학상 숨은 공로자
매년 노벨과학상이 발표되면 필자는 노벨재단 사이트에서 해설을 다운로드받아 시간 날 때 읽어보곤 했다. 그런데 올해 노벨과학상 해설은 아직도 못 봤다. 한국 소설가 한강이 노벨문학상을 받으면서 책을 여러 권 사서 읽고 있기 때문이다. 과학작가로서 직무유기일까.
그러다 10월 31일자 학술지 '네이처'에 실린 짧은 인터뷰 기사에 눈길이 갔다. 2024 노벨화학상의 숨은 공로자인 헬렌 버먼(Helen Berman)이 주인공으로 50여 년 전 출범한 단백질정보은행(Protein Data Bank. 이하 PDB)의 공동설립자이자 1999년부터 15년 동안 소장을 역임한 인물이다.
단백질 구조예측 AI 프로그램인 알파폴드를 만든 존 점퍼와 단백질 설계 프로그램인 로제타를 개발하고 AI를 도입해 로제타폴드로 업그레이드한 데이비드 베이커는 수상 소감에서 "이게 다 PDB 덕분"이라고 말했고 '네이처'가 PDB의 산증인인 버먼을 찾은 것으로 보인다.
필자는 기사에 실린 버먼의 얼굴을 보고 바로 알아봤는데 지난해 대한민국과학기술유공자로 뽑혀 헌정식에 참여하기 위해 방한한 버클리대 화학과 김성호 명예교수와 일련의 인터뷰를 하면서 버먼의 얘기를 꽤 들어 찾아본 적이 있기 때문이다. 당시 김 교수는 버먼이 대단한 사람이라고 했는데 정말 그런 것 같다. 헬렌 버먼은 누구인가.
● 김성호와 취미 연구 프로젝트 함께 해
1943년 미국 시카고에서 태어나 뉴욕에서 자란 버먼은 의사인 아버지의 성실함과 지역사회 활동에 적극적이었던 어머니의 활달함을 물려받은 엄친딸이다. 버먼은 바너드대 화학과를 다니며 결정학에 관심을 가져 1964 당시 미국 결정학의 메카인 피츠버그대 화학과 조지 제프리 교수 밑에서 박사과정에 들어갔다.
영국인인 제프리는 본토에 워낙 쟁쟁한 결정학자들이 많아 1953년 피츠버그대의 초빙에 응해 미국으로 건너갔고 그 뒤 30여 년 동안 수많은 인재를 배출하며 미국 결정학 발전에 큰 공을 세웠다.
당시 실험실의 3년차 박사과정 학생이 신입생 버먼의 사수 역할을 했는데 바로 6년 연상의 김성호였다. 1960년대만 해도 결정학은 장비가 무거워 육체적으로도 꽤 힘든 분야라 여학생이 거의 없었다.
김 교수는 "버먼은 꽤 수다스러워 다소 삭막했던 실험실에 활기를 부여했다"고 회상했다. 두 사람은 수산화요소와 단당류인 메틸글루코사이드의 결정을 만들어 구조를 밝히는 연구를 함께 했다.
김성호는 1966년 박사학위를 받고 그해 겨울 MIT 생물학과에 박사후연구원으로 갔고 버먼은 1967년 학위를 받고 2년 더 머물다가 1969년 폭스체이스암센터로 옮겼다. 여기까지면 언급하지도 않았겠지만 김성호가 MIT로 떠난 뒤에도 두 사람의 인연이 이어졌기에 얘기가 길어졌다. 바로 취미 공동 프로젝트를 진행한 것이다.
박사학위를 받을 무렵 김성호는 자연에 존재하는 염기 두 개로 된 작은 핵산인 UpA의 결정을 만드는 데 성공했다. MIT로 옮기면서 틈이 날 때 취미 삼아 구조를 밝혀보자는 아이디어가 떠올랐고 버먼과 MIT 생물학과에서 알게 된 박사과정 학생 조엘 수스먼을 끌어들였다. 버먼은 막 박사과정에 들어온 네드 시먼을 참여시켜 회원은 네 명이 됐다. 이들은 스스로를 'UpA 갱단(gang)'이라고 불렀다.
이렇게 해서 서로 다른 기관에서 일하던 네 사람이 참여하는 취미 연구 프로젝트가 시작됐다. 김 교수는 "실험실과 독립된 연구라 X선 장비를 만드는 회사로 결정을 갖고 가서 X선 회절 데이터를 얻었다"며 "연구 결과는 전달RNA(tRNA) 구조 해석 과정에서 꽤 도움이 됐다"고 회상했다. 이들의 논문은 1971년 저명한 학술지인 '네이처 뉴바이올로지'에 실렸다.
지난 2014년 미국결정학회 홈페이지에는 '북미의 결정학'이라는 제목의 회고록이 실렸는데 미국 결정학의 대부인 제프리 교수를 비중있게 다루며 그 제자 세 사람도 소개했다. 바로 김성호와 버먼, 시먼으로 이들의 취미 연구 프로젝트와 함께 그 뒤 세 사람이 이룬 주요 업적도 언급했다. 청출어람청어람(靑出於藍靑於藍)인 셈이다.
김성호 교수는 1974년 tRNA 구조를 밝혀 일약 스타가 됐고 1988년에는 암 관련 단백질인 라스(ras)의 구조를 규명해 다시 한번 주목을 받은 구조생물학의 개척자다. 1945년생으로 회원 가운데 가장 젊은 시먼은 뉴욕대에 자리를 잡아 DNA 염기 상보성을 이용해 계산을 하거나 나노미터 크기의 구조물을 만드는 'DNA 나노테크놀로지' 분야를 개척했다. 이처럼 기발한 아이디어가 넘쳤던 시먼은 안타깝게도 2021년 75세에 가장 먼저 세상을 떠났다.
● 1971년 PDB 공동설립자로
헬렌 버먼은 결정학 연구를 계속했지만 단백질의 데이터베이스를 만들고 관리하는데 더 관심을 쏟았다. 1960년대 후반 이미 단백질 구조 정보가 생명과학뿐 아니라 의학 발전에도 중요한 역할을 할 것임을 내다본 버먼은 당시 하나둘 밝혀진 단백질 구조 정보가 체계적으로 관리되지 못하는 현실이 안타까워 뜻을 같이 하는 몇몇 젊은 결정학자들과 대책을 모색했다.
이들은 1970년과 1971년 미국결정학협회 모임에서 만나 아이디어를 구체화했고 1971년 6월 콜드스프링하버연구소에서 열린 심포지엄에서 발표해 여러 과학자의 동의를 얻었다. 마침 현장에 있었던 미국 브룩헤이븐국립연구소(BNL)의 저명한 화학자 월터 해밀턴은 젊은 과학자들의 열정에 감명을 받아 도와주겠다고 나섰고 바로 영국으로 날아가 케임브리지결정학데이터센터(CCDC)를 만든 올가 케나드를 만났다.
이렇게 해서 1971년 10월 BNL과 CCDC가 함께 운영하는 단백질정보은행(PDB)이 문을 열었다. 당시 28세였던 버먼은 공동설립자로 이름을 올렸다. 시작할 때 등록된 단백질은 7개에 불과했지만 1976년 미국과학재단에서 3만3000달러를 지원한 걸 계기로 널리 인정받기 시작했고 1980년대 결정학 기법이 발달해 구조 규명 속도가 빨라지면서 등록된 단백질 구조 데이터도 빠르게 늘었다.
1998년 PDB의 주관 기관이 BNL에서 구조생물정보학연구협력체(RCSB)로 바뀌면서 당시 럿거스대 화학과 교수였던 버먼이 이듬해 소장으로 취임해 15년간 봉직했다. 이때 PDB는 비약적으로 발전했는데 특히 2003년 wwPDB를 설립하면서 국제기구가 됐다(ww는 worldwide의 약자다). 당시 창립 회원은 RCSB와 PDBe(유럽), PDBj(일본)이고 2006년 생물학적자기공명은행(BMRB)이 가입했다.
이런 지리적인 확장뿐 아니라 데이터에 단백질을 이루는 각 원소의 좌표를 넣는 방식을 통일해 접근성을 높였고 무엇보다도 '네이처'나 '사이언스' 같은 권위 있는 학술지가 단백질 구조 규명 논문을 싣는 조건으로 PDB에 먼저 데이터를 넘기는 조건을 걸면서 PDB의 권위가 높아졌다. 이 과정에서 PDB의 전문가들이 데이터의 품질을 평가해 등록 여부를 결정한다.
한편 1999년 버먼이 소장으로 뽑혔을 때 김성호 교수는 난감한 입장에 놓였다. 앞서 취미 연구 프로젝트의 회원인 수스먼은 김 교수가 1972년 듀크대 교수로 자리를 옮겼을 때 이듬해 박사후연구원으로 와 3년 동안 같이 연구했고 이후 바이츠만과학연구소에 자리 잡아 이스라엘 결정학의 대부가 됐다. 수스먼은 1994년부터 5년 동안 PDB의 소장을 지냈다.
그런데 1998년 PDB의 소속이 BNL에서 럿거스대와 샌디에이고 캘리포니아대가 관리하는 RCSB로 넘어가면서 이듬해 럿거스대의 버먼이 차기 소장 후보로 나섰다. 수스먼은 연임을 하고 싶었지만 공동설립자인 버먼의 상대가 되지 못했다.
김 교수는 "같이 취미 연구를 했던 옛 친구들이 그 일로 한동안 사이가 나빠 중간에서 정말 곤란했다"며 당시의 당혹스러운 상황을 회상했다. 그러나 지금 생각하면 버먼이 소장이 돼 15년 동안 이끈 결과 오늘날의 PDB가 있는 게 아닌가 한다.
● 고품질에 접근성도 좋아
PDB에 등록된 단백질은 2023년 1월 20만 개를 돌파했다. 놀라운 사실은 이 모두가 실험을 통해 결정된 구조라는 것이다. 알파폴드 같은 프로그램이 예측한 구조의 데이터는 받아주지 않는다.
결국 알파폴드와 로제타폴드가 성공할 수 있었던 건 세계 연구자 누구에게나 공개된 PDB의 고품질 실험 데이터를 학습한 덕분인 셈이다. 만일 PDB가 실험 데이터라고 무조건 받아주거나 예측 데이터가 섞여 있는 상태였다면 AI 프로그램이 잘못된 학습으로 지금 같은 성능을 발휘하지는 못했을 것이다. 2024 노벨화학상 수상자들이 PDB에 고마워하는 이유다.
버먼은 '네이처' 인터뷰에서 "PDB 데이터는 전문가의 검증을 받았고 기계(AI 프로그램)가 완전히 읽어 들일 수 있다"라며 "알파폴드와 로제타폴드 같은 AI 프로그램이 내놓은 결과를 보면 정말 정말 기쁘다"라고 말했다. 다음날 노벨상 시상식에 버먼도 초대받지 않을까.
※ 필자소개
강석기 과학칼럼니스트 (kangsukki@gmail.com). LG생활건강연구소에서 연구원으로 근무했으며, 2000년부터 2012년까지 동아사이언스에서 기자로 일했다. 2012년 9월부터 프리랜서 작가로 활동하고 있다. 직접 쓴 책으로 《강석기의 과학카페》(1~7권),《생명과학의 기원을 찾아서》가 있다. 번역서로는 《반물질》, 《가슴이야기》, 《프루프: 술의 과학》을 썼다.
[강석기 과학 칼럼니스트 kangsukki@gmail.com]
Copyright © 동아사이언스. 무단전재 및 재배포 금지.