알파폴드가 풀지 못한 98%의 유전체까지 해독… 구글 ‘알파게놈’ 공개

신혜정 2026. 1. 29. 01:02
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

단백질 구조 예측 AI '알파폴드(AlphaFold)'로 노벨화학상을 받았던 구글 딥마인드가 인간 유전체의 작동 방식을 예측하는 AI 모델 '알파게놈(AlphaGenome)'을 공개했다.

나타샤 라티셰바 구글 딥마인드 연구원은 "알파게놈은 인간과 생쥐 데이터를 학습했지만, 개인 유전체 예측에 대한 상세한 훈련까지 수행하지는 못했다"며 "알파게놈은 의사를 대신하는 도구가 아니라 연구 속도를 높이는 도구"라고 강조했다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

유전자 작동 원리 예측하는 AI 개발해
'네이처' 발표한 구글 딥마인드 연구진
“임상 도구 아닌 연구 속도 높이는 AI”
구글 딥마인드의 유전체 예측 AI 모델 '알파게놈'이 소개된 국제학술지 '네이처' 표지. 네이처 제공

단백질 구조 예측 AI ‘알파폴드(AlphaFold)'로 노벨화학상을 받았던 구글 딥마인드가 인간 유전체의 작동 방식을 예측하는 AI 모델 '알파게놈(AlphaGenome)'을 공개했다. 생명체의 ‘재료’인 단백질을 넘어, 이 재료가 어떻게 생명 현상으로 발현되는지 결정하는 복잡한 지도까지 AI로 파악하겠다는 것이다.

구글 딥마인드 연구진은 29일 국제학술지 ‘네이처’에 알파게놈 개발 과정을 담은 논문을 발표했다. 푸시밋 콜리 딥마인드 과학부문 부사장은 28일 언론 브리핑에서 "단백질이 생명의 레고 블록이라면, DNA(디옥시리보핵산)는 (단백질) 조립 방법을 알려주는 레시피"라며 “알파게놈을 통해 DNA라는 언어의 문법을 이해하고 의미를 찾아낼 수 있다"라고 설명했다.

알파폴드의 분석 대상이 유전체의 2%에 해당하는 단백질(암호화 영역)이라면, 알파게놈은 나머지 98%에 해당하는 ’비암호화 영역’을 분석한다. 이 영역은 단백질을 직접 만들지는 않지만, 유전자 발현을 조절하는 역할을 한다. 그동안 이 영역의 복잡성 때문에 질병 원인을 파악하기 어려웠다. 수십억 개의 염기쌍으로 이뤄진 유전체 중 단 하나만 바뀌어도 예상치 못한 변이가 일어날 정도로 복잡하기 때문이다.

그래픽=송정근 기자

기존에도 AI로 복잡한 유전체를 해독하려는 시도는 있었다. 그러나 기존 모델들은 긴 DNA 서열을 읽으면 해상도가 떨어지는 한계가 있었다. 연구진은 이러한 '입력 길이'와 ‘해상도'의 상충 현상을 극복했다. 알파게놈은 최대 100만 염기쌍(1Mb)이라는 방대한 문맥을 입력받으면서도 단일 염기(1bp) 수준의 초정밀 해상도로 예측을 수행한다. 이를 통해 멀리 떨어진 조절 부위가 특정 유전자에 미치는 영향을 파악하고, 유전자 발현량, 유전정보 편집 과정(스플라이싱), 염색질 구조 등 11가지 생물학적 특징을 동시에 예측해낸다.

연구진은 학습 방식에서도 효율성을 높였다. '지식 증류' 기법을 도입해 여러 개의 모델이 학습한 지식을 하나의 모델로 압축했다. 기존에는 생물학적 특징별로 개별 모델을 사용하는 경우가 많았지만, 딥마인드 연구진은 여러 특징을 하나의 모델에서 동시에 학습시키는 방식을 택해 효율을 높이고 연산 비용을 줄였다.

연구진에 따르면 알파게놈을 이용해 컴퓨터 시뮬레이션만으로도 복잡한 질병 기전을 실험실 수준으로 파악할 수 있다. 실제로 연구진은 T세포 급성 림프모구 백혈병 관련 유전자(TAL1)를 분석해 비암호화 영역의 변이가 어떻게 암을 유발하는지 정확히 예측해냈다.

알파게놈은 희소질환을 진단하고 유전자 치료를 설계하는 데 큰 기여를 할 전망이다. 딥마인드는 비(非)상업 연구를 위해 모델의 코드와 가중치를 전면 공개한다고 밝혔다. 다만 아직까지는 임상 적용보다 연구용이라는 설명이다. 나타샤 라티셰바 구글 딥마인드 연구원은 “알파게놈은 인간과 생쥐 데이터를 학습했지만, 개인 유전체 예측에 대한 상세한 훈련까지 수행하지는 못했다”며 “알파게놈은 의사를 대신하는 도구가 아니라 연구 속도를 높이는 도구”라고 강조했다.

신혜정 기자 arete@hankookilbo.com

Copyright © 한국일보. 무단전재 및 재배포 금지.