생각을 텍스트로 바꾸는 휴대용 AI 개발

원호섭 기자(wonc@mk.co.kr) 2023. 12. 14. 08:03
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

호주 연구진이 인공지능(AI)을 이용, 생각을 텍스트로 전환할 수 있는 휴대용 장치를 개발하는 데 성공했다.

연구진은 이번 기술이 뇌졸중과 같은 질병으로 말을 하지 못하는 사람들의 의사소통을 돕는 데 사용될 수 있을 것으로 기대하고 있다.

연구진이 공개한 시연 영상에 따르면 연구진이 개발한 모자를 쓴 사람이 말을 하지 않은 채 생각을 하자, 뒤에 있는 화면에 "좋은 오후야. 난 샷을 추가한 카푸치노 부탁해" "닭고기 수프 하나 주세요" 와 같은 문장들이 나타났다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

호주 시드니공과대 연구진
뇌파 읽어 문자로 쓰는 기술 개발
“정확도 높여 장애인 돕는데 활용”
실험 참가자가 EEG를 측정하는 기기를 쓰고 생각을 문자로 전환하고 있다. 뒤 화면에 보이는 글이 참가자가 하는 생각이다. 다만 휴대하기에는 조금 불편할 것 같다. [사진=호주공과대 유튜브 캡처]
호주 연구진이 인공지능(AI)을 이용, 생각을 텍스트로 전환할 수 있는 휴대용 장치를 개발하는 데 성공했다. 연구진은 이번 기술이 뇌졸중과 같은 질병으로 말을 하지 못하는 사람들의 의사소통을 돕는 데 사용될 수 있을 것으로 기대하고 있다.

시드니공과대학 연구진은 사람이 간단히 쓸 수 있는 뇌파 측정기를 이용해 뇌에서 발생하는 뇌전도(EEG)를 구별해 낸 뒤 이를 문자로 번역해 주는 휴대용 기기를 개발했다고 밝혔다. 해당 논문은 지난 10일부터 미국 뉴욜리언스에서 개최 중인 세계 최대 머신러닝 학회 ‘NeurlPS 2023’에서 발표됐으며 ‘스포트라이트 논문’으로 선정됐다.

연구진은 EEG를 이용해 두피에서 발생하는 전기적 활동을 측정하는 휴대용 AI 시스템을 만들었다. 실험에 참여한 사람들은 이 시스템을 머리에 쓴 뒤 문자 구절을 생각으로 읽었는데, 이때 뇌파가 발생하고 이 모자가 이를 측정한다. 뇌에서 발생하는 EEG 파동은 별개의 단위로 구분이 가능한데, 연구진을 이를 ‘디웨이브’라 불리는 AI를 이용해 학습시켰다. 디웨이브는 많은 양의 뇌파 데이터로부터 학습해 뇌파 신호를 단어와 문장으로 번역한다. 예를 들어 ‘사과’를 생각했을 때 나타나는 뇌파와 ‘딸기’를 생각할 때 발생하는 뇌파는 서로 다른데, 이를 기록해 AI로 학습시킨 것이다.

연구진이 공개한 시연 영상에 따르면 연구진이 개발한 모자를 쓴 사람이 말을 하지 않은 채 생각을 하자, 뒤에 있는 화면에 “좋은 오후야. 난 샷을 추가한 카푸치노 부탁해” “닭고기 수프 하나 주세요” 와 같은 문장들이 나타났다. 이는 실험 참가자가 머리 속으로 생각한 문장이었다. 연구진은 29명을 대상으로 해당 실험을 진행했다.

일반적으로 뇌파를 정확히 이해하려면 머리뼈를 열고 뇌에 전극을 꽂아야만 한다. 이 과정을 거치지 않으면 뇌파가 머리뼈를 뚫고 나오는 과정에서 잡음이 많아지는 만큼 정확한 뇌파를 확인하기가 어려웠다. 하지만 이번 연구는 뇌파 측정에 있어서 기존 연구를 뛰어넘는 성과를 보였다는 게 연구진의 설명이다.

연구를 이끈 씨티(CT) 린 시드니 공과대학 교수는 “이번 연구는 EEG를 언어로 번역하는 노력을 보여줬다”라며 “이 분야에서 중요한 돌파구를 마련했다고 생각한다”라고 말했다. 그는 “우리가 개발한 휴대용 AI 시스템은 최초로 뇌와 문자 번역 과정에 인코딩 기술을 통합하는 혁신적인 접근 방식을 도입했다”라며 “대규모 언어모델을 통합하는 것은 신경과학, AI 분야에서 새로운 지평을 열고 있다”라고 덧붙였다.

다만 ‘BLEU-1’에서 번역 정확도 점수는 현재 40% 정도다. BLEU는 기계 번역 결과와 사람이 직접 번역한 결과가 얼마나 유사한지를 측정하는 방법이다. 0이 가장 작고 1이 가장 큰 값인데 40%인 만큼 완벽한 해독은 못 하고 있다. 연구진은 이를 90%까지 끌어올려 전통적인 언어 번역, 음성 인식 프로그램에 버금가는 수준으로 만들어 나가겠다는 계획이다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?