단백질과 모든 생체분자 상호작용 예측하는 AI 나왔다… “신약 개발 활로 열어”

이병철 기자 2024. 5. 9. 00:27
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

딥마인드·아이소모픽랩스 공동 연구진 ‘알파폴드3′ 공개
단백질과 생체 분자 상호작용 예측 정확도 역대 최고
“신약 개발, 디지털 세포 개발로 이어질 것”

구글 모(母)회사인 알파벳의 인공지능(AI) 자회사인 딥마인드가 새로운 단백질 3차원(3D) 구조 예측 모델을 공개했다. 이번에는 단순한 구조 예측을 뛰어넘어 단백질이 우리 몸 안에서 어떻게 상호작용할 수 있는지 손쉽게 예측할 수 있는 기술을 선보였다. 이에 따라 과학계를 넘어 제약·바이오 산업계에도 AI를 통한 혁신이 가속화될 전망이다.

딥마인드와 아이소모픽랩스 공동 연구진은 9일 국제 학술지 ‘네이처’에 단백질과 모든 생체 분자의 상호 작용을 예측할 수 있는 AI 모델 ‘알파폴드3′ 개발 결과를 발표했다. 아이소모픽랩스는 딥마인드의 창업자인 데미스 허사비스가 창업한 신약 개발 전문 기업이다.

알파벳의 인공지능(AI) 자회사 딥마인드가 공개한 알파폴드3로 예측한 코로나바이러스의 단백질. 알파폴드3는 단백질과 다른 생체 분자 사이의 복잡한 상호작용을 높은 정확도로 예측할 수 있다고 회사는 소개하고 있다./딥마인드

이번에 공개한 알파폴드3은 2022년 공개한 알파폴드 멀티머(multimer)의 후속 버전이다. 알파폴드 멀티머는 단백질 하나의 3D 구조를 예측하는 것을 뛰어넘어 두 개 이상의 단백질의 상호작용을 예측할 수 있는 기능으로 주목 받았다. 단백질은 다른 단백질과 상호작용을 통해 여러가지 기능을 나타내는 만큼 단백질 신약 개발을 위해서는 상호작용에 관한 연구가 필수적이다.

알파폴드3은 단백질 사이의 상호작용 이외에도 다른 생체분자와의 상호작용도 높은 정확도로 예측할 수 있다고 연구진은 설명했다. 이론적으로 유전정보를 담고 있는 디옥시리보핵산(DNA)이나 유전자 발현을 조절하는 리보핵산(RNA)과 단백질이 어떻게 상호작용 하는지 예측할 수 있다면 여러 불치병의 치료법을 찾을 수 있다. 단백질은 우리 몸의 다양한 생체 분자와 상호작용해 다양한 생명현상을 나타내기 때문이다.

연구진은 “단백질이 다른 분자와 상호작용하는 방식이 워낙 다양 단일 모델로는 구현하기 어려웠다”며 “알파폴드3은 이전의 어떤 모델보다도 높은 정확도로 다양한 생체 분자의 상호작용을 예측할 수 있다”고 소개했다.

알파폴드3은 단백질과 리간드(화합물의 분자, 이온) 사이의 상호작용에서 80%에 가까운 정확도를 보였다. 기존에 가장 정확했던 AI 모델의 정확도가 60%에 미치지 못했던 것을 고려하면 획기적으로 성능을 높인 것이다. DNA와 상호작용은 60%, RNA와는 40%로 역시 기존 모델보다 우수한 성능을 보였다.

알파폴드3에는 알파폴드2에 쓰였던 에보포머(evoformer) 알고리즘을 개선한 페어포머(pairformer) 알고리즘을 적용했다. 에보포머는 3D 공간의 특징과 단백질의 진화 정보를 동시에 분석해 알파폴드의 정확도 향상에 기여한 방식이다. 이번에 페어포머를 도입해 여러 종류의 생체 분자에 대한 예측 정확도를 높였다. 페어포머는 원자의 3D 좌표를 직접 예측하는 방식의 알고리즘이다.

단백질과 생체 분자의 상호작용 예측은 최근 AI를 이용한 신약 개발 시도가 활발해지면서 주요 연구 분야로 떠올랐다. 단백질의 구조를 예측하는 AI도 신약 개발에 도움이 될 수 있으나, 실제로 효능과 부작용을 예측하려면 생체 내 모든 물질과 어떻게 상호작용하는지 알아야 한다. 알파폴드와 함께 단백질 구조 예측 AI를 대표하는 로제타폴드도 지난 3월 ‘로제타폴드 올아톰’이라는 이름으로 단백질, 생체 분자 상호작용 예측 모델을 공개했다.

로제타폴드로 예측한 단백질 IL-12와 수용체가 결합한 구조. /Ian Haydon/Institute for Protein Design

로제타폴드 개발을 주도한 백민경 서울대 생명과학부 교수는 “단백질 구조를 AI로 예측한다는 것만으로는 실제 활용 분야가 제한적이었다”며 “다른 생체 분자까지 확대한다면 신약 개발에 AI가 활용될 가능성이 커졌다”고 설명했다.

다만 실제 연구 현장에서 알파폴드3을 사용하려면 일부 성능을 보완해야 한다. 연구진은 “크기가 큰 생체 분자 사이의 상호작용 예측에서 일부 오류가 발생했다”며 “카이랄성을 예측하는 데 4.4%의 오차가 있었다”고 평가했다. 카이랄성은 같은 원자들로 구성됐지만 왼손과 오른손처럼 좌우가 서로 뒤집힌 분자 구조가 만들어지는 성질이다. 원자 구성이 같더라도 카이랄성이 다르면 약물이 부작용을 일으킬 수 있다.

물론 단백질과 생체 분자의 상호작용 예측 정확도가 꾸준히 높아지면서 머지않아 디지털 세포를 만들어 신약을 개발하는 것도 가능해질 전망이다. 백 교수는 “디지털 세포는 세포 안에서 일어나는 모든 일을 디지털로 구현하는 기술”이라며 “허사비스도 과거 디지털 세포를 개발하겠다는 목표를 제시했다”고 말했다. 딥마인드 연구진은 “알파폴드3은 물리학 기반 구조 예측 방식을 뛰어넘는 최초의 AI 모델”이라며 “아이소모픽랩스와 협력해 이전에는 개발하지 못했던 신약을 개발하기 위해 이미 연구를 하고 있다”고 말했다.

참고 자료

Nature(2024), DOI: https://doi.org/10.1038/s41586-024-07487-w

- Copyright ⓒ 조선비즈 & Chosun.com -

Copyright © 조선비즈. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?