‘노벨상 AI’ 알파폴드3 코드 공개…바이오 연구 새 시대 열리나

홍아름 기자 2024. 11. 12. 14:06
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

구글 딥마인드의 단백질 구조 예측 인공지능(AI)인 알파폴드3의 실체가 드디어 공개됐다.

프랑스 국립과학연구센터(CNRS) 연구진은 지난달 국제 학술지 '네이처 컴퓨테이셔널 사이언스'에 "알파폴드2로 단백질 구조를 예측하는 데 걸리는 시간을 줄이는 소프트웨어인 매시브폴드(MassiveFold)에 알파폴드3를 통합하고 싶다"며 "새 코드를 통합해 알파폴드2나 알파폴드3에서 최상의 예측 결과를 얻을 수 있을 것"이라고 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

구글 딥마인드, 11일 SW 공유사이트에 공개
단백질과 다른 분자의 상호작용도 예측
네이처 “알파폴드3와 비슷한 AI가 대거 등장”
구글 딥마인드./구글 딥마인드 홈페이지 화면 갈무리

구글 딥마인드의 단백질 구조 예측 인공지능(AI)인 알파폴드3의 실체가 드디어 공개됐다. 과학계는 앞으로 단백질 관련 AI의 성능이 더 개선되고, 활용 범위도 넓어질 수 있다고 기대했다.

구글 딥마인드는 11일(현지 시각) 알파폴드3의 소스 코드를 연구 목적에 한해 공개한다고 발표했다. 소스 코드는 소프트웨어의 제작에 쓰이는 설계도 역할의 핵심 코드를 말한다. 지난 5월 딥마인드가 논문을 통해 알파폴드3의 가상 코드를 공개해 논란을 빚은 지 6개월 만의 결정이다.

알파폴드는 2018년 처음 나왔다. 딥마인드의 데미스 허사비스 최고경영자(CEO)외 존 점퍼 수석연구원은 알파폴드를 개발한 공로로 올해 노벨 화학상을 받았다. 최신 버전인 알파폴드3는 이전 버전과 달리 단백질과 DNA, RNA를 포함한 다른 분자가 함께 작용하는 방식까지 예측할 수 있어 과학계와 산업계의 관심이 집중됐다.

하지만 딥마인드는 연구와 상업적 목적 사이의 균형을 유지한다는 이유로 알파폴드3의 소스 코드를 공개하지 않았다. 국제 학술지 네이처에 알파폴드3의 가상 코드를 공개하고, 알파폴드3를 하루 최대 10건 사용하도록 제한하는 조건을 달아 서비스를 제공하는 데 그쳤다.

당시 과학자들은 딥마인드의 결정에 대해 재현성을 훼손하는 조치라고 강하게 비판했다. 알파폴드3의 코드나 매개변수에 대한 정보 없이는 단백질의 구조를 정확하게 예측했는지 평가할 수 없고, 기능을 개선하기도 어렵기 때문이다.

논문 발표 후 논란이 일자 딥마인드는 6개월 안에 알파폴드3의 오픈 소스 버전을 공개하겠다고 밝혔다. 오픈 소스는 여러 연구자가 새로운 기능이나 수정 사항을 자유롭게 반영할 수 있도록 만든 소프트웨어다. 이날 딥마인드는 소속 기관이 있는 연구자를 대상으로 알파폴드의 소프트웨어 코드를 다운로드해 활용할 수 있도록 했다.

알파폴드3의 오픈 소스가 공개되면서 연구자들은 AI를 각자 원하는 조건에 맞게 개선해 단백질과 다른 분자 사이의 상호 작용을 예측할 수 있다. 올해 노벨 화학상 수상자인 존 점퍼 딥마인드 수석연구원은 “사람들이 이것으로 무엇을 할지 매우 기대된다”고 밝혔다.

실제로 알파폴드3의 이전 버전인 알파폴드2의 오픈 소스가 공개된 뒤에 연구자들은 암과 관련된 표적 물질에 결합하는 단백질 구조를 설계하거나, 정자가 난자에 붙는 데 중요한 역할을 하는 핵심 단백질을 식별했다. 점퍼 수석연구원은 “사람들은 그것(알파폴드3)을 이상한 방식으로 사용할 것”이라며 “때로는 실패하고 때로는 성공할 것이다”고 기대했다.

네이처지는 딥마인드의 결정을 두고 “알파폴드3 코드를 바탕으로 한 비슷한 AI가 대거 등장할 것”이라고 예측했다. 앞서 소셜미디어인 틱톡을 개발한 중국 회사 바이트 댄스와 기술 거대 기업인 바이두, 라이고 바이오사이언스, 차이 디스커버리와 같은 회사가 알파폴드3의 가상 코드가 담긴 논문을 참고해 비슷한 모델을 출시했다.

이미 알파폴드3의 코드를 활용할 계획을 세운 곳도 있다. 프랑스 국립과학연구센터(CNRS) 연구진은 지난달 국제 학술지 ‘네이처 컴퓨테이셔널 사이언스’에 “알파폴드2로 단백질 구조를 예측하는 데 걸리는 시간을 줄이는 소프트웨어인 매시브폴드(MassiveFold)에 알파폴드3를 통합하고 싶다”며 “새 코드를 통합해 알파폴드2나 알파폴드3에서 최상의 예측 결과를 얻을 수 있을 것”이라고 밝혔다.

한발 더 나아가 상업적인 용도로도 자유롭게 사용할 수 있는 소프트웨어도 나올 전망이다. 모하메드 알쿠라이시 컬롬비아대 교수는 네이처에 올해 말까지 완전히 오픈 소스 형식인 ‘오픈폴드3′ 모델을 출시할 계획이라고 밝혔다. 제약 회사가 자체 데이터를 사용해 AI 모델을 학습시키고, 성능을 개선할 수 있도록 할 예정이다.

참고 자료

GitHub, https://github.com/google-deepmind/alphafold3

Nature(2024), DOI: https://doi.org/10.1038/s41586-024-07487-w

Nature Computational Science(2024), DOI: https://doi.org/10.1038/s43588-024-00714-4

- Copyright ⓒ 조선비즈 & Chosun.com -

Copyright © 조선비즈. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?