개인 맞춤형 정밀 의료 앞당기는 '데이터 렌즈'

이병구 기자 2024. 5. 9. 11:48
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

국내 연구팀이 유전자의 특징을 빠르고 정확하게 해독해 유용한 생물학적 정보만 골라내는 데이터 분석 도구를 개발했다.

기초과학연구원(IBS)은 김재경 수리및계산과학연구단 의생명수학그룹 CI(Chief Investigator) 연구팀이 유전자를 분석한 빅데이터에서 유용한 생물학적 정보만 골라내는 새로운 데이터 분석 도구 'scLENS'를 개발하고 연구결과를 지난달 27일 국제학술지 '네이처 커뮤니케이션즈'에 공개했다고 9일 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

IBS, 유전자 해독해 유용한 생물학적 정보만 골라내는 도구 개발
유전자 분석 데이터에서 유용한 생물학적 정보만 골라내는 새로운 데이터 분석 도구가 개발됐다. 게티이미지뱅크

국내 연구팀이 유전자의 특징을 빠르고 정확하게 해독해 유용한 생물학적 정보만 골라내는 데이터 분석 도구를 개발했다. 개인 맞춤형 정밀 치료 등에 활용될 것으로 기대된다.

기초과학연구원(IBS)은 김재경 수리및계산과학연구단 의생명수학그룹 CI(Chief Investigator) 연구팀이 유전자를 분석한 빅데이터에서 유용한 생물학적 정보만 골라내는 새로운 데이터 분석 도구 'scLENS'를 개발하고 연구결과를 지난달 27일 국제학술지 '네이처 커뮤니케이션즈'에 공개했다고 9일 밝혔다. 

단일세포의 전사체 분석은 개별 세포 단위에서 유전적 변화를 확인할 수 있어 생물학, 신약 개발, 임상 등 여러 분야에서 주목받는다. 전사체는 유전체에서 유전자 발현을 위해 전사된 모든 RNA 분자를 뜻한다. 예를 들어 전사체 분석으로 암 조직 내 수십 가지 종류의 세포를 구분하고 유전적 변이가 발생한 세포만 표적으로 정밀 치료할 수 있다.

전사체 분석이 널리 쓰이려면 분석 데이터에서 유용한 생물학적 신호만 찾아내는 분석 도구가 필요하다. 수백~수천 개에 이르는 세포의 다양한 유전자 발현량을 측정한 데이터 용량은 수십 기가바이트(GB)에 달한다. 방대한 데이터 중 생물학적으로 유용한 신호는 3% 내외에 불과하다.

유용한 신호를 골라내기 위해 그간 여러 데이터 처리 도구가 개발됐지만 기존 도구는 사용자가 직접 유용한 신호와 잡신호(노이즈)의 경계선을 직접 설정해야 했다. 분석하는 사람의 주관이 개입되어 결과에 편차가 있고 정확도가 떨어진다는 한계가 있다.

연구팀은 수학적 방법론인 '랜덤 행렬 이론'을 이용해 사용자의 주관적 선택 없이 전사체 분석 데이터에서 신호와 노이즈를 구별하는 프로그램 'scLENS'를 개발했다. 랜덤 행렬 이론은 복잡한 시스템 속의 대규모 데이터에서 신호가 노이즈에 가려지더라도 중요 패턴과 구조를 식별할 수 있는 방법론이다.

사용자가 주관적으로 신호를 선별하는 기존 전사체 데이터 분석 방법(왼쪽)과 연구팀이 개발한 csLENS가 데이터 기반으로 신호를 선택해 분석하는 과정. IBS 제공

연구의 제1 저자인 김현 연구원은 "scLENS는 데이터에 내재한 구조만을 이용해 자동으로 신호와 노이즈를 구별하기 때문에 사용자의 편향성을 원천 차단한다"며 "노동집약적인 신호 선별 과정을 없애면서도 분석 정확성은 높였다"고 설명했다.

연구팀은 기존 데이터 분석 프로그램 11개와 scLENS의 성능을 비교했다. 가장 널리 쓰이는 프로그램인 '쇠라(Seurat)'와 비교해 scLENS는 세포를 그룹화하는 성능이 약 10% 우수하고, 데이터 속의 구조를 43% 더 효과적으로 포착했다. 또 scLENS는 기존 프로그램보다 많은 계산을 하면서도 메모리 사용을 최적화해 분석 속도도 빨랐다.

김재경 CI는 "단일세포 전사체를 분석할 수 있는 실험 기술이 비약적으로 발전했지만 데이터 분석 방법의 한계로 큰 비용과 시간을 투자해 얻은 데이터를 최대한 활용하지 못했다"며 "기초 수학 이론이 생명과학 연구 혁신을 견인하고 생명의 비밀을 빠르고 정확하게 밝히는 데 쓰인다는 것을 보여줬다"고 밝혔다.
 

[이병구 기자 2bottle9@donga.com]

Copyright © 동아사이언스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?