[표지로 읽는 과학] 수천 시간→몇 분… AI로 단백질 생성 정확히 재현

정지영 기자 2025. 8. 17. 08:49
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

이번 주 국제학술지 '사이언스(Science)' 표지에는 딥러닝 기반 인공지능(AI) 시스템 '바이오이뮤(BioEmu)'가 생성한 단백질 구조가 실렸다.

색이 선명하지 않고 흐릿해 보이는 부분은 단백질이 취할 수 있는 다양한 3차원 형태를 겹쳐 놓은 것으로, 끊임없이 움직이며 모양을 바꾸는 '단백질의 흔들림(PROTEIN SHAKE)'을 나타낸다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

사이언스 제공.

이번 주 국제학술지 '사이언스(Science)' 표지에는 딥러닝 기반 인공지능(AI) 시스템 '바이오이뮤(BioEmu)'가 생성한 단백질 구조가 실렸다. 전화선처럼 구불구불하게 꼬인 붉은색과 흰색 이미지는 단백질의 뼈대를 단순화해 표현한 것이다.

색이 선명하지 않고 흐릿해 보이는 부분은 단백질이 취할 수 있는 다양한 3차원 형태를 겹쳐 놓은 것으로, 끊임없이 움직이며 모양을 바꾸는 '단백질의 흔들림(PROTEIN SHAKE)'을 나타낸다. 이미지는 BioEmu가 생성한 데이터를 바탕으로 제작됐다. 

미국 마이크로소프트 리서치의 '과학을 위한 AI(AI for Science)'팀, 독일 베를린자유대, 미국 라이스대 등 공동연구팀은 단백질이 만들 수 있는 모든 단백질 구조를 빠르고 정확하게 예측하는 새로운 AI 모델 BioEmu에 대한 연구 결과를 10일(현지시간) 사이언스에 발표했다.

단백질의 기능을 이해하기 위해서는 다양한 환경에서의 구조 변화를 파악하는 것이 필수적이다. 기존의 분자 역학(MD) 시뮬레이션에서 단백질이 어떻게 움직이는지 정확하게 알아내려면 중앙처리장치(GPU)를 통한 수만 시간 이상의 연산이 필요했다. 

BioEmu는 전통적인 분자 시뮬레이션보다 더 빠르고 효과적인 대안을 제시한다. BioEmu는 MD보다 1만 배 이상 빠른 속도로 단백질의 평형 상태(equilibrium ensemble)를 모방했다. 단백질이 실제로 어떤 비율로 어떤 구조를 취하는지 컴퓨터로 정확하게 구현했다는 의미다. MD로는 수천 시간이 걸리는 계산을 BioEmu는 최단 몇 분 만에 끝냈다. 

연구팀은 딥마인드에서 만든 알파폴드(AlphaFold)에서 사용된 '진화 기반 변환기(Evoformer)' 기술을 활용해 단백질 서열을 데이터로 변환했다. 이렇게 얻은 정보를 AI 확산 모델에 입력했다. 그러자 처음에는 아무 의미 없어 보이는 듯 하다가 점점 그림을 완성하듯 진짜 같은 3차원(3D) 단백질 구조를 만들어냈다.  

또 '속성-예측-미세-조정(Property-Prediction Fine-Tuning, PPFT)'이라는 새로운 학습 방법도 개발했다. 수많은 분자 역학 시뮬레이션 데이터와 50만 건이 넘는 실험 데이터를 함께 학습시켜 BioEmu가 더 정확하게 단백질 특성을 예측하게 만드는 기술이다.

연구 결과 BioEmu는 단백질이 얼마나 안정적으로 접히는지를 실제 값과 거의 똑같이, 오차 1kcal/mol 미만으로 예측했다. mol은 분자의 개수를 세는 단위로, 1몰은 대략 6.02×10²³개 분자를 말한다. kcal/mol은 에너지 단위를 나타내는 말로, 단백질이 접히는 데 필요한 에너지를 설명할 때 쓰인다. BioEmu를 이용해 나온 폴딩 안정성이 실제 실험값과 거의 차이가 없다는 의미다. 

BioEmu의 가장 큰 강점은 단순히 단백질 구조를 예측하는 것을 넘어 기능적 변화를 정확하게 포착한다는 점이다. 약물이 결합하는 '결합 포켓(binding pocket)'의 형성이나 단백질의 기능적 스위치 역할을 하는 '도메인 움직임' 등 복잡한 생체 현상을 성공적으로 재현했다.

연구팀은 BioEmu가 MD 시뮬레이션과 상호보완적으로 사용될 것으로 예상했다. 연구팀은 "이 기술은 신약 개발의 병목 현상을 해결하고, 단백질 설계와 같은 다양한 생명공학 분야를 혁신할 잠재력을 가지고 있다"고 강조했다. 

<참고 자료>
- doi.org/10.1126/science.adv9817

[정지영 기자 jjy2011@donga.com]

Copyright © 동아사이언스. 무단전재 및 재배포 금지.