일기예보, 질병 등 인과관계 추정 정확도 높이는 방법 개발

문세영 기자 2023. 7. 26. 13:54
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

시간의 흐름을 기준으로 기록한 데이터를 '시계열 데이터'라고 한다.

기초과학연구원(IBS) 연구팀이 수학모델을 기반으로 시계열 데이터의 인과관계를 추정하는 새로운 방법론을 개발했다.

시계열 데이터에서 인과관계를 추정하는 대표적인 방법은 '그레인저 인과관계 검정'인데, 이를 개선한 정보 이론 기반의 다양한 인과관계 추정 방법들이 개발되고 있다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

김재경 IBS 수리 및 계산 과학 연구단 의생명 수학그룹 CI 연구팀
(왼쪽부터) 이번 연구에 참여한 김재경 IBS 수리 및 계산 과학 연구단 의생명 수학 그룹 CI, 박세호·하석민 KAIST 학부생.

시간의 흐름을 기준으로 기록한 데이터를 ‘시계열 데이터’라고 한다. 일기 예보 등에 쓰이는 이

데이터는 의학 분야에서도 가치 있게 쓰인다. 웨어러블 기기를 통해 일상에서 건강 데이터를 쉽게 수집할 수 있게 되면서 의학 분야에서의 활용도가 점점 커지고 있다. 

가령 환자의 심전도를 측정해 심장 발작의 직접적인 요인을 찾는 등 인과관계를 추정하는 데 쓰일 수 있다. 기초과학연구원(IBS) 연구팀이 수학모델을 기반으로 시계열 데이터의 인과관계를 추정하는 새로운 방법론을 개발했다. 

IBS는 김재경 수리 및 계산 과학 연구단 의생명 수학 그룹 CI(KAIST 수리과학과 교수) 연구팀이 기존보다 빠르게 추론하면서 정확도를 높인 인과관계 추정 방법론을 24일 국제학술지 ‘네이처 커뮤니케이션즈’에 발표했다고 26일 밝혔다. 

연구팀이 개발한 방법론은 ‘GOBI(General ODE-Based Inference)’다. 시계열 데이터에서 인과관계를 추정하는 대표적인 방법은 ‘그레인저 인과관계 검정’인데, 이를 개선한 정보 이론 기반의 다양한 인과관계 추정 방법들이 개발되고 있다. 하지만 시계열 데이터가 비슷한 주기로 변화하는 동시성을 가지면 잘못 예측하는 경우가 많고, 직접적인 인과관계와 간접적인 인과관계를 구별하지 못하는 한계가 있다. 

이를 극복하기 위해 수리 모델 기반 방법론들이 등장했다. 하지만 정확한 수리 모델을 알기 힘들고, 현재까지 제시된 방법론들은 복잡한 계산 때문에 추정 시간이 긴 단점이 있다. 이에 연구팀은 GOBI를 개발해 이러한 단점을 보완했다. 연구팀은 일반적인 수학 모델로 시계열 데이터를 표현할 수 있는지 확인하는 수학이론을 만들고, 이 이론을 바탕으로 정확한 수리 모델이나 복잡한 계산 없이 시계열 데이터로부터 인과관계를 추정하는 방법론을 개발했다. 

이 방법론을 인과관계 분석에 적용해 본 결과 세포 내 분자들의 상호작용, 생태계 네트워크, 기상 시스템 등 다양한 분야의 데이터에서 기존 대비 월등한 성능을 보였다. 동시성과 간접적 영향을 가지는 시계열 데이터에서도 인과관계 추론에 성공했다. 연구진은 이 방법론을 이용해 여러 오염 물질 중 이산화질소와 호흡기로 유입되는 부유 미립자가 심혈관계 질환에 영향을 미친다는 것을 확인했다. 

김 CI는 “수학과 통계를 결합해 정확하면서도 다양한 시스템에 유연하게 적용할 수 있는 새로운 인과관계 추정 방법론을 개발했다”며 “사회 및 자연과학 분야에 걸쳐 두루 사용되는 인과관계 추정 연구에 새로운 패러다임을 제시할 것으로 예상된다”고 말했다.

[문세영 기자 moon09@donga.com]

Copyright © 동아사이언스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?