노벨화학상 받은 AI?

조회 62025. 1. 22.

어려운 단백질 구조를 예측하는 AI '알파폴드'를 만든 CEO와 수석 연구원이 2024년 노벨 화학상을 받았습니다. 알파폴드는 수십 년이 걸리는 복잡한 단백질 구조 분석을 단시간에 해결하며 신약 개발과 생명과학 연구에 혁신을 가져왔다고 하는데요. 자세한 내용은 정책주간지 'K-공감'에서 확인하세요.

'신'이 된 알파폴드
인간이 수천 년 걸릴 일을 단 하루에

‘컴퓨터 프로그램에 노벨상 수상 자격이 주어진다면….’

2020년 12월 1일. 유명 베스트셀러 ‘이기적 유전자’의 저자이자 생명과학자인 리처드 도킨스는 자신의 X(옛 트위터)에 이러한 글과 함께 한 기사를 인용했습니다. 단백질 구조 예측 분야에서 ‘알파폴드’라 불리는 인공지능(AI)이 독보적인 성과를 내고 있다는 내용이 담긴 기사였습니다. 도킨스의 예상처럼 알파폴드를 만든 데미스 허사비스 구글 딥마인드 최고경영자(CEO)와 존 점퍼 수석 연구원은 2024년 노벨 화학상을 받았습니다.

알파폴드는 얼마나 뛰어나길래 노벨 과학상을 받게 됐을까요?

알파폴드3 단백질 구조 예측 이미지. 사진 딥마인드

AI가 예측하는 단백질 구조

우리 몸을 구성하고 있는 데옥시리보핵산(DNA)은 리보핵산(RNA)을 거쳐 생명 현상에 필요한 단백질을 만들어냅니다. 단백질은 세포의 구성 성분일 뿐 아니라 효소, 호르몬, 항체 등의 주성분으로 인간이 생명을 유지하는 데 많은 기능을 수행합니다. 단백질이 인간의 몸속에서 워낙 중요한 역할을 하다보니 많은 글로벌 제약사는 이 단백질을 조절함으로써 질병을 예방하고 또 치료할 수 있는 신약 개발에 나서고 있습니다. 예를 들어 세포의 문지기 역할을 하는 단백질이 있는데 이 단백질과 결합할 수 있는 물질을 만들면 바이러스 등이 세포에 들어가는 것을 원천적으로 차단할 수 있습니다.

문제는 단백질 구조를 예측하는 일이 상당히 어렵다는 데 있습니다. 한 종류의 단백질 구조를 분석하는 데 짧게는 수개월에서 길게는 수십 년이 걸립니다. 엄청난 돈과 시간을 투자한다고 해서 무조건 좋은 결과가 나오는 것도 아닙니다. 특정 단백질 구조를 밝혀낸 과학자가 노벨상을 받은 일도 상당히 많았습니다.

바로 이 과정을 AI가 공략했습니다. 단백질은 마치 기다란 끈이 말려 있거나 접혀 있는 것처럼 보이는 ‘아미노산’으로 이뤄져 있습니다. 아미노산은 20개만 존재하는데 인류는 그동안 아미노산의 특징을 파악한 데이터를 보유하고 있습니다. 여기에 인류가 50년 동안 파악해왔던 단백질 구조 데이터도 있습니다.

단백질을 구성하고 있는 아미노산의 종류를 알고 있고, 또 각각의 아미노산 특성에 대한 데이터도 있고, 이러한 아미노산이 얽히고 설켜 만들어진 단백질 구조도 데이터베이스로 만들어놨습니다. 이제 할 일은 AI에 이를 학습시키고 새로운 아미노산끼리 만났을 때 어떤 구조를 보일지 예측하라고 하는 것입니다.

AI는 학습한 데이터를 기반으로 새로운 ‘수’를 제시하는 데 탁월합니다. 학습을 마친 AI가 왜 이러한 답을 내놓는지 정확히 알 수는 없지만 확률적으로, 그리고 합리적으로 나은 제안을 하는 만큼 이러한 특징이 단백질 예측 분야와 잘 맞아떨어졌습니다.

알파폴드를 만든 허사비스 CEO 역시 이러한 사실을 잘 알고 있었습니다. 그는 미국 매사추세츠공대(MIT) 박사 과정 시절에 가상의 공간에서 단백질 구조를 찾는 게임 ‘폴드잇’을 접한 뒤 단백질 구조 예측이 바둑을 둘 때 다음 수를 놓는 것과 같다고 생각했습니다. 허사비스는 이러한 생각으로 알파고를 만들었고 알파고가 이세돌 9단을 이긴 뒤 곧바로 알파폴드팀을 꾸려 단백질 구조 예측에 나섰습니다. 그렇게 알파폴드는 2018년 단백질 구조 접합을 맞히는 대회에 출전해 1위를 한 뒤 이제껏 사람으로 구성된 팀을 압도하고 있습니다.

새로운 미래를 개척하는 알파폴드

압도적인 성과를 내는 알파폴드2에는 ‘어텐션 네트워크’라는 딥러닝 기술이 사용됐습니다. 이는 챗GPT와 같은 거대언어모델(LLM)의 핵심기술로 꼽힙니다. 학습한 데이터 중에서 다음에 올 가장 최적화된 ‘단어’를 찾듯이 알파폴드2는 학습한 단백질 구조와 아미노산의 특징 중에서 확률적으로 가장 가능성이 큰 아미노산을 찾아냅니다. 이러한 AI 기술을 기반으로 알파폴드2는 지구상에 존재하는 2억 개의 단백질 중 99%의 구조를 예측했습니다. 그리고 이를 과학자들이 연구에 활용할 수 있도록 무료로 제공했습니다. 만약 사람이 이러한 일을 직접 해야만 했다면 수백·수천 년이 걸렸을 것입니다.

현재 많은 기업이 알파폴드2를 이용해 단백질의 구조를 예측하고 이를 신약 개발 등에 활용하고 있습니다. AI를 활용하면 기존보다 적은 비용으로 더 빠르게 신약후보 물질을 확인할 수 있는 만큼 신약 개발 기간을 크게 줄일 수 있기 때문입니다. 보스턴컨설팅그룹의 연구에 따르면 AI 기반으로 신약을 개발하는 기업을 분석한 결과 설계한 신약후보 물질의 임상 1상 성공률은 80~90%으로 기존 업계 평균보다 높은 것으로 조사됐습니다. 딥마인드는 2021년 알파폴드 기반의 약물 연구를 위해 ‘아이소모픽랩스’를 만들었는데 현재 일라이릴리, 노바티스 등 글로벌 제약사와 공동 연구를 이어가고 있습니다.

원호섭
과학이 좋아 마블 영화를 챙겨보는 공대 졸업한 기자.
‘과학 그거 어디에 써먹나요’,
‘10대가 알아야 할 미래기술10’ 등을 썼다.

이 콘텐츠가 마음에 드셨다면?
이런 콘텐츠는 어때요?

최근에 본 콘텐츠와 구독한
채널을 분석하여 관련있는
콘텐츠를 추천합니다.

더 많은 콘텐츠를 보려면?

채널탭에서 더 풍성하고 다양하게 추천드려요