AI가 설계한 '인공 단백질'이 신약으로 빛 보려면

문세영 기자 2024. 11. 5. 14:22
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

올해 노벨 화학상을 안긴 인공지능(AI) 프로그램인 '알파폴드'와 '로제타폴드'는 규명되지 않았던 단백질 구조를 정확히 예측하는 것은 물론 지금까지 존재하지 않던 새로운 단백질을 설계할 수도 있다.

과거에는 X선이나 극저온 전자현미경 등을 이용해 단백질 구조를 해독했지만 이제는 AI가 단백질 데이터 뱅크(PDB)에 있는 수십만 개의 단백질 구조를 학습해 실험실 환경이 아닌 컴퓨터만으로 새로운 단백질 구조를 만들 수 있는 시대가 됐다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

네이처, 단백질 구조 예측 AI의 과제 소개
다양한 단백질 구조의 모습. 위키미디어 제공.

올해 노벨 화학상을 안긴 인공지능(AI) 프로그램인 ‘알파폴드’와 ‘로제타폴드’는 규명되지 않았던 단백질 구조를 정확히 예측하는 것은 물론 지금까지 존재하지 않던 새로운 단백질을 설계할 수도 있다. 바이러스나 암세포와 싸워 이기는 인공 단백질을 만들어 신약으로 활용할 수 있다는 의미다.

다만 원하는 단백질 구조를 자판기에서 뽑듯 간단하게 설계하는 단계에 이르려면 아직 해결해야 할 과제들이 남아있다. 국제학술지 ‘네이처’가 4일(현지시간) 인류가 단백질 설계의 이점을 활용하려면 극복해야 할 과제를 소개했다.  

과거에는 X선이나 극저온 전자현미경 등을 이용해 단백질 구조를 해독했지만 이제는 AI가 단백질 데이터 뱅크(PDB)에 있는 수십만 개의 단백질 구조를 학습해 실험실 환경이 아닌 컴퓨터만으로 새로운 단백질 구조를 만들 수 있는 시대가 됐다. 

단백질 설계시 중요한 초기 과제 중 하나는 단백질 간 결합에 대한 이해도를 높이는 것이다. 단백질 결합제(바인더)는 질병 발생 경로를 활성화하거나 억제하는 약물로 작용할 수 있기 때문이다. 2024년 노벨 화학상 수상자인 데이비드 베이커 미국 워싱턴대 교수는 ‘알파프로테오’와 같은 생성형 AI 프로그램을 통해 실질적으로 단백질 결합제를 생성했다. 

단백질 결합과 관련한 데이터의 양이 적어 AI가 학습할 내용이 많지 않다는 점은 현재의 한계점이다. 학습량이 부족하면 신뢰도가 높은 단백질 결합제를 얻기 어렵다. 생성형 AI 시스템이 '할루시네이션(허위 정보 생산)'을 일으킬 수 있기 때문이다. 알파폴드3가 생체분자와 단백질 간 상호작용에 대한 예측 정확도를 높였지만 아직 많은 개선이 필요하다는 지적이다.

단백질 분해효소를 설계하는 것도 중요한 도전 과제다. 필요한 단백질 분해효소를 설계하면 대기 중 이산화탄소를 씻어낼 수 있는 촉매나 플라스틱을 효율적으로 분해할 수 있는 효소가 나올 수 있다.    

천연 효소를 기반으로 인공 효소를 설계하는 방법도 제안된다. 하지만 천연 효소와 유사한 형태를 지닌 인공 효소가 반드시 동일한 기능과 효과를 낸다고 볼 수는 없다. 이상적인 인공 효소를 설계하기 위한 방법 마련이 필요하다. 

단백질 구조의 복잡도를 높이는 것도 풀어야 할 과제다. 복잡한 구조를 활용하면 알츠하이머병과 같은 질환으로 접힌 단백질을 펴거나 세포 내로 물질을 운반하거나 물리적인 힘을 생성할 수 있다.

신종 코로나바이러스 감염증(코로나19) 백신이 대표적인 예다. 코로나19 백신은 코로나바이러스의 스파이크단백질에서 면역반응을 촉발하는 단백질들로 구성된 나노 입자다. 컴퓨터를 통해 설계한 복잡한 단백질 구조가 현실 세계에 잘 활용될 수 있다는 점을 보여준 대표적인 예시다. 

단백질의 형태와 움직임에 대한 이해도 높아져야 한다. 단백질은 주변 온도, pH, 화학물질, 분자 결합 여부 등에 따라 비틀어지고 구부러지며 구조 변화가 일어난다.  단백질 구조를 실험적으로 관찰하면 단백질이 활성 상태일 때 일반적으로 보이는 가장 안정적인 형태만 관찰된다.

단백질의 다양한 움직임과 형태를 알아내기 위한 계산 속도를 높여야 하는데 이는 머신러닝을 통해 지속적으로 향상될 것으로 기대된다.  

연구자들이 단백질 예측 프로그램의 부정적인 결과물을 공개하지 않는다는 점도 개선이 필요한 부분으로 꼽힌다. 딥러닝 과정에서 알고리즘이 단백질 세포 독성 등 부정적인 결과도 학습해야 단백질의 안정성과 잠재적 유용성이 높아진다는 설명이다.

[문세영 기자 moon09@donga.com]

Copyright © 동아사이언스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?