AI로 목소리 분석, 노년층 치매 위험군 찾는다
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
국내 연구진이 노년층의 음성 발화(發話)를 분석해 치매 전 단계인 경도인지장애 및 치매 고위험군을 선별하는 인공지능(AI) 기술과 앱을 개발했다.
한국전자통신연구원(ETRI)은 복합지능연구실이 기존에 개발한 AI 기술을 바탕으로 일상생활 대화와 관련한 음성 발화 입력을 이용해 경도인지장애 고위험군을 예측하는 태블릿 기반 앱 개발을 완료했다고 1일 밝혔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
국내 연구진이 노년층의 음성 발화(發話)를 분석해 치매 전 단계인 경도인지장애 및 치매 고위험군을 선별하는 인공지능(AI) 기술과 앱을 개발했다.
한국전자통신연구원(ETRI)은 복합지능연구실이 기존에 개발한 AI 기술을 바탕으로 일상생활 대화와 관련한 음성 발화 입력을 이용해 경도인지장애 고위험군을 예측하는 태블릿 기반 앱 개발을 완료했다고 1일 밝혔다. 음성 발화는 기억·의도·주의집중 등 인지기능과 음운·통사·의미 등 언어 생성 기능, 호흡·조음·발성 등 구어 운동 기능이 순차적으로 작용하는 복합적인 과정이다.
복합지능연구실은 음성처리 분야에서 축적된 AI 기술과 음성, 텍스트 및 영상 멀티모달 기술을 바탕으로 디지털 치료제 등 헬스케어 분야로 연구를 확장하고 있다. 특히 일상생활의 대화 등을 통해 입력되는 노년층의 음성 발화를 분석해 경도인지장애, 치매 등 퇴행성 뇌 기능 저하를 평가하고 예측하는 AI 기술을 개발했다. 이 기술은 음성 발화 분석을 통해 경도인지장애 및 치매 환자에게서 나타나는 인지, 언어, 운동 능력의 저하를 조기에 판단하고 예측할 수 있다.
연구팀은 해당 기술을 2021년 영국 에든버러대와 미국 카네기멜런대에서 주최하는 어드레소(ADReSSo) 데이터셋 챌린지에 참가해 정확도를 평가했다. 어드레소 데이터는 음성 발화를 이용해 치매 위험을 예측하는 모델을 만들기 위해 AI 개발자들이 사용하는 공유 데이터다. 복합지능연구실이 개발한 AI 기술은 이 챌린지에서 87.3%의 정확도를 기록했다. 연구 성과는 올해 2월 ETRI 저널에 게재된 바 있다.
복합지능연구실은 후속 연구로 최근 각광을 받고 있는 시각언어모델(VLM) 기술을 적용해 AI 기술의 성능을 높였다. 노년층, 특히 경도인지장애 및 치매 고위험군에서 흔히 나타나는 부정확한 발음, 사투리 발화 등으로 분석에 어려움은 있었지만 축적된 음성 및 멀티모달 AI 기술을 바탕으로 이를 극복했다.
복합지능연구실은 연구 결과를 바탕으로 일상생활 대화 과제를 중심으로 한 음성 발화 입력을 통해 경도인지장애 고위험군을 예측하는 태블릿 기반 앱을 개발했다. 실제 수요자인 노년층의 사용자 편의성 및 정확도 개선에 주안점을 두고 개발했다. 한국전기연구원과 노인복지센터 등에서 앱을 실제로 사용할 수 있는지 실험에 나설 예정이다.
강병옥 복합지능연구실 책임연구원은 “노년층이 보건소에 직접 방문해 경도인지장애 및 치매 고위험군인지 선별검사를 받는 방식에 비해 스마트기기를 통한 대화 기반의 검사 방식은 지속적, 주기적 모니터링이 가능하다는 장점이 있다”고 말했다. 치매 고위험군 노년층이 조기에 경도인지장애 여부를 확인하고 초기부터 지속적인 관리를 통해 치매로 진행되는 시기를 낮추는 데 도움이 될 전망이다.
이번 성과는 AI와 의료 기술의 융합을 통해 치매 예방과 조기 진단의 새로운 길을 열었다는 평가를 받고 있다. 향후 상용화를 통해 치매 치료를 위한 사회적 비용을 절감하고 글로벌 디지털 치료제 시장에서 큰 반향을 일으킬 것으로 보인다.
[이채린 기자 rini113@donga.com]
Copyright © 동아사이언스. 무단전재 및 재배포 금지.