진화하는 KT 지니.. 희노애락 '공감하는 AI' 나온다

김나인 2022. 5. 22. 16:33
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

스스로 주변·전후 상황 학습
언어·영상 통해 인간과 소통
'기가지니' 서비스 등에 적용
이정한 KT 융합기술원 AI2XL연구소 전임연구원이 E2E 음성인식 기술을 시연하고 있다. KT 제공
배순민 KT 융합기술원 AI2XL연구소장이 'KT AI 2.0' 연구 방향을 발표하고 있다. KT 제공

'초거대 인공지능' 연내 상용화

KT가 음성지능, 언어지능, 시각지능 등 초거대 AI(인공지능)를 연내 상용화하고 이를 통해 KT의 모든 AI 서비스 수준을 한 단계 진화시킨다는 'KT AI 2.0' 비전을 밝혔다. 인간의 상호작용에서 가장 큰 특징인 '공감능력'을 갖춘 AI를 내놓겠다는 청사진도 제시했다. 사람의 말과 표정 등에서 맥락을 캐치하고, 그 속에 들어있는 희노애락에 공감하는 AI가 선보일 전망이다.

KT는 지난 19일 서울 서초구 KT 융합기술원에서 'KT AI 2.0' 연구 방향을 발표했다. 이날 배순민 KT 융합기술원 AI2XL 연구소장은 "KT가 개발하고자 하는 AI의 차별화 방향은 '공감하는 AI'"라며 "진화된 KT AI는 스스로 주변 및 전후 상황을 학습해 사용자가 원하는 순간에 적절히 개입할 수 있게 될 것"이라고 밝혔다.

초거대 AI란 대용량 연산이 가능한 인프라를 바탕으로 대규모 데이터를 학습해 사람처럼 스스로 사고할 수 있도록 설계된 AI를 뜻한다. KT 측은 구글 등 국내외 대기업들이 연구에 뛰어들고 있는 초거대 AI를 활용한 한국어 언어모델이 상용화되면 다양한 산업 영역에서 혁신이 이뤄질 것으로 기대했다.

KT는 지난 2020년 산학연 협동 연구조직 'AI 원팀'을 구성하고 연구개발 및 상용화를 진행해왔다. KT는 특히 '공감능력'에 초점을 맞췄다. 배 소장은 "KT 초거대 AI 기반으로 진화된 한국어 언어모델이 인간의 상호작용에서 가장 큰 특징인 '공감능력'을 갖춘 최초의 AI가 될 것"이라고 자신했다.

KT AI는 딥러닝 학습을 거쳐 사람의 언어를 이해하고, 데이터를 토대로 언어 생성도 할 수 있게 된다. 시끄러운 환경에서도 불완전한 문장을 문맥을 추론해 이해할 수 있다. 과거 대화의 기억을 되살려 사용자와 단순한 언어로 소통하며 감정을 담아내는 것도 가능하다. 또 영상이나 사진 등을 활용해 상황이나 동작을 분석해 인간과 소통할 수 있게 된다. 카이스트와의 공동연구를 통해 인문학, 인지과학과의 융합과 공감하는 UX(사용자경험) 기반으로 인간 중심의 AI를 구현한다는 계획이다. KT와 AI 원팀은 초거대 AI모델을 연내 상용화할 예정이다. 대규모 AI 연산 인프라를 구축하고, 향후 2000억 파라미터(매개변수) 이상의 모델까지 가능하도록 인프라 규모를 확대할 계획이다.

배 소장은 이 기술을 △차세대 AICC(AI컨택센터) △기가지니(AI 스피커) △지니버스(자체 개발 메타버스) △ AI로봇 △차세대 지능형교통체계(C-ITS) 등의 서비스 분야에 적용할 계획이라고 밝혔다. 가령 육아나 법률 등 전문 분야에도 AI가 사람처럼 연속 대화가 가능하도록 '멀티턴 전문 상담' 서비스를 개발하고, 현재 330만명 이용자가 활용하는 '기가지니'의 대화 품질도 높인다. 특히 고도화된 AICC 솔루션을 활용해 올해 1800억원 이상의 AICC 수주를 달성하겠다는 계획이다. 아울러 AI 원팀과 함께 개방형 R&D 생태계를 만들고, AI 연구개발 포털인 '지니랩스'를 오픈해 KT AI를 금융·차량·로봇·물류 등의 다양한 산업분야로 확산한다는 방침이다.

이날 KT는 청각지능 시연에서 자체 개발한 '엔드투엔드 음성인식' 기술을 선보였다. 딥러닝 모델로 구성된 KT의 E2E 음성인식기는 유튜브에 올라온 뉴스 리포트를 약 5초만에 화면에 글자로 옮기는 등 자유발화에 높은 성능을 보여줬다. 사용자가 말하는 순간의 음성을 실시간으로 처리하는 것도 가능하다.

언어지능 시연에서는 초거대 AI 모델을 활용한 문장 생성과 요약 기술을 선보였다. 문장 생성은 AI가 어휘 변용한 문장을 자동 생성해 스스로 학습 성능을 높일 수 있는 기술로, 학습데이터 구축 시간과 비용을 기존 대비 3분의 1로 단축시킬 수 있다. 서영경 KT 융합기술원 전임연구원은 "상담사가 내용을 이해하고 응대하는 시간을 초거대 AI를 통해 획기적으로 단축할 수 있다"고 설명했다. 시각지능은 눈·비·역광·가려짐 등 제한된 상황에서도 도로의 작은 객체를 검출할 수 있는 C-ITS 등에 활용된다. 배 소장은 "'비욘드 AI'로 즉 한계를 뛰어넘는 AI를 보여주겠다"며 "단순히 이성적이고 똑똑한 AI뿐 아니라 감성적인 AI와 사용자 경험을 만들고자 한다"고 말했다.

김나인기자 silkni@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?