KAIST “AI로 단백질 속 숨겨진 효소 찾아낸다”

2023. 11. 24. 08:26
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

대장균은 가장 많이 연구된 생명체 중 하나에 해당되지만 아직 대장균을 구성한 단백질 30%의 기능에 대해 명확하게 밝혀지지 않았다.

국내 연구진이 인공지능(AI)을 활용해 아직 명확하게 밝혀진 바 없던 단백질에서 464종의 효소를 발견, 이 중 3종의 단백질의 예측된 기능을 시험관 내 효소 분석 방법을 통해 검증했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

- 이상엽 특훈교수팀, 효소기능 예측 인공지능 ‘딥 EC 트랜스포머’ 개발
이상엽 KAIST 생명화학공학과 특훈교수.[KAIST 제공]

[헤럴드경제=구본혁 기자] 대장균은 가장 많이 연구된 생명체 중 하나에 해당되지만 아직 대장균을 구성한 단백질 30%의 기능에 대해 명확하게 밝혀지지 않았다. 국내 연구진이 인공지능(AI)을 활용해 아직 명확하게 밝혀진 바 없던 단백질에서 464종의 효소를 발견, 이 중 3종의 단백질의 예측된 기능을 시험관 내 효소 분석 방법을 통해 검증했다.

카이스트(KAIST)는 생명화학공학과 이상엽(사진) 특훈교수와 캘리포니아대학교 샌디에이고(UCSD) 생명공학과 버나드 펄슨 교수 공동연구팀이 단백질 서열을 활용, 해당 단백질의 효소 기능을 예측할 수 있는 인공지능 ‘딥 EC 트랜스포머’를 개발했다고 24일 밝혔다.

효소는 생물학적 반응을 촉매하는 단백질로서, 생명체 내 존재하는 다양한 화학 반응과 이에 따라 결정되는 생명체의 대사 특성을 파악하기 위해서는 각 효소의 기능을 이해하는 것이 필수적이다. EC 번호(효소 고유 번호)는 국제생화학 및 분자 생물학연맹이 고안한 효소 기능 분류 체계로서, 다양한 유기체의 대사 특성을 이해하기 위해선 게놈 서열에서 존재하는 효소의 종류와 EC 번호를 빠르게 분석할 수 있는 기술 개발이 필요하다.

공동연구팀은 심층학습 기법과 단백질 상동성 분석 모듈을 활용해 주어진 단백질 서열의 효소 기능을 예측하는 인공지능 딥 EC 트랜스포머(DeepECtransformer)를 개발했다. 연구팀은 이번 연구에서 더 다양한 효소 기능을 정확하게 예측할 수 있도록 단백질 서열 전체 문맥에서 효소 기능에 중요한 정보를 추출하였고, 이를 통해 효소의 EC 번호를 정확하게 예측할 수 있었다. 개발된 인공지능은 총 5360종류의 EC 번호를 예측할 수 있었다.

딥 EC 트랜스포머 인공신경망 구조.[KAIST 제공]

특히 딥 EC 트랜스포머의 인공신경망 내 정보 흐름을 분석해 인공지능이 추론 과정에서 효소 기능에 중요한 활성 부위나 보조 인자 결합 부위 정보를 활용하고 있다는 사실을 밝혀냈다. 이처럼 인공지능의 블랙박스를 해석함으로써 인공지능이 학습 과정에서 스스로 효소 기능에 중요한 특징을 파악하고 있음을 연구팀은 확인했다.

이상엽 특훈교수는 “효소 기능을 빠르고 정확하게 예측하는 딥 EC 트랜스포머는 기능 유전체학의 핵심 기술로서 시스템 수준에서 전체 효소들의 기능들을 분석할 수 있게 한다”며 “이를 활용해 모든 효소 정보를 포함한 대사 네트워크를 기반으로 친환경 미생물 공장 개발을 수행할 수 있을 것”이라고 밝혔다.

이번 논문은 국제학술지 ‘네이처 커뮤니케이션즈’ 11월 14일 게재됐다.

nbgkoo@heraldcorp.com

Copyright © 헤럴드경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?