"신약후보물질 설계 빨라지나"…알지 못했던 ‘단백질 기능’ 빠르게 찾다
단백질 기능 패턴 ‘몇 초만에’..검색 20배, 색인생성 11배 빨라

단백질은 생명체를 구성하는 핵심 물질이자 다양한 생명 현상 유지에 중요한 역할을 한다. 체내에서는 화학 반응을 촉진하는 효소로 작용해 신진 대사와 에너지 생성, 세포 성장 및 복구 등을 돕는다.
이런 단백질의 기능은 단백질 구성요소인 아미노산이 사슬처럼 복잡하게 접혀 형성하는 '3차원 구조'가 결정한다. 이 구조가 특정 분자와 결합하거나 화학 반응을 촉진하는 능력을 결정한다.
서열상 떨어져 있는 몇 개의 아미노산이 특정 각도와 위치로 모여 만드는 작은 입체 패턴을 '구조 모티프'라 하는데, 이 패턴이 단백질의 '기능 스위치'이자 기능을 알려주는 일종의 '지문' 역할을 한다.
구글 딥마인드가 개발한 알파폴드 2 등장 이후 과거 수십 년에 걸쳐 실험으로 알아내던 단백질 구조를 인공지능(AI) 기술을 통해 며칠 만에 수억 개씩 예측할 수 있게 돼 단백질 디자인과 인공 효소, 신약 설계가 빠르게 발전하고 있다.
하지만 AI가 예측한 방대한 구조 데이터에서 특정 기능 패턴을 찾는 데 상당한 저장공간과 시간이 소요된다.
국내 연구진이 단백질 기능을 결정하는 핵심 구조 패턴을 단 몇 초 만에 찾아내는 검색 기술을 개발했다.
이 검색 기술은 미지 영역인 단백질 기능을 빠르게 찾아내 인공 효소 제작이나 신약후보 물질 설계 등 바이오·의약 분야에 널리 쓰일 전망이다.
한국연구재단은 마틴 슈타이네거 서울대 교수 연구팀이 수억 개에 달하는 단백질 구조를 초고속으로 탐색해 기능을 찾아주는 검색 도구 '폴드디스코'를 개발했다고 11일 밝혔다.
연구팀이 개발한 폴드디스코는 3차원 구조에서 서로 인접한 아미노산 쌍의 거리, 각도, 방향 등 7가지 기하학적 정보를 수치화해 색인하는 방식을 도입했다.
특히 아미노산의 '곁사슬 방향' 정보까지 더해 기능 부위에서 나타나는 미세한 모양 변화까지 정밀하게 구분할 수 있다. 아미노산의 위치 정보는 저장하지 않는 '위치 없는 색인' 기술로 저장 공간을 크게 줄여 후보 구조를 빠르게 선별한 뒤 아미노산 배치가 유사한 패턴 구조를 빠르게 찾아낸다.
흔한 패턴은 낮은 점수를, 드문 기능 패턴은 높은 점수를 부여하는 '희소성 기반 채점' 방식을 도입해 탐색 정확도를 높였다.
이런 특성으로 폴드디스코는 5300만개 구조를 1.45TB(테라바이트) 색인으로 수 초 안에 검색할 수 있었다. 이는 기존 최고 성능 대비 검색은 20배, 색인 생성은 11배 빠른 것이다. 저장 공간은 4배 줄였다.

폴드디스코를 아주 짧은 활성 부위 모티프부터 멀리 떨어진 구조 패턴까지 모두 검색할 수 있다. 연구팀은 폴드디스코를 활용해 그동안 기능을 알지 못했던 굴·폐수 유래 단백질에서 새로운 구조 모티프 '아연집게'를 찾아냈고, 세포막 수용체의 활성·비활성 상태를 명확히 구분하는 등 우수성을 확인했다.
이에 따라 미지의 단백질 기능을 규명하는 연구는 물론, 특정 활성 부위를 가진 인공 효소 제작이나 신약 후보 물질 설계 등 바이오·의약 분야 전반에 널리 활용될 것으로 기대된다.
마틴 슈타이네거 교수는 "다만 현재의 폴드디스코는 단백질 구조 검색에만 국한되어 있어, 핵산이나 약물처럼 단백질과 상호작용하는 다른 생체분자까지는 다루지 못한다는 과제가 남아 있다"며, "향후 검색 범위를 생체분자 전반으로 확장해, 복잡한 생명 현상을 입체적으로 분석할 수 있는 통합 도구로 발전시킬 계획이다"라고 밝혔다.
슈타이네거 교수는 "다만 현재의 폴드디스코는 단백질 구조 검색에만 한정돼 있어 핵산이나 약물처럼 단백질과 상호작용하는 다른 생체분자까지는 다루지 못하는 과제가 남아 있다"며 "앞으로 검색 범위를 생체분자 전반으로 확장해 복잡한 생명 현상을 입체적으로 분석할 수 있는 통합 도구로 발전시킬 계획"이라고 말했다. 연구결과는 생명과학 분야 국제 학술지 '네이처 바이오테크놀로지' 지난 5일 온라인에 실렸다.
이준기 기자 bongchu@dt.co.kr
Copyright © 디지털타임스. 무단전재 및 재배포 금지.