와이즈넛, 인간처럼 사고하는 AI 시대 앞당긴다…'멀티모달 RAG' 개발 착수

송혜리 기자 2024. 8. 29. 15:03
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

와이즈넛은 과학기술정보통신부가 주관하는 정보통신방송기술개발사업 중 정보통신기획평가원(IITP)이 추진하는 '멀티모달 데이터 입력 기반 검색증강생성 기술 개발'과제 주관사로 1차년도 연구에 착수했다고 29일 밝혔다.

오는 2027년까지 4년에 걸쳐 진행되는 이번 연구는 실제 업무환경에서 융합대 활용되는 멀티모달 데이터를 기반으로 초거대언어모델(LLM)의 구조적·성능적 한계로 제기되는 ▲최신화된 정보유지의 어려움 ▲할루시네이션 ▲도메인 정보 부족 ▲대규모 컴퓨팅자원소요 등의 한계를 극복하는 멀티모달 검색증강생성(RAG) 기술 개발을 목표로 한다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

과기정통부 '멀티모달 데이터 입력 기반 검색증강생성 기술 개발'과제 주관사
강용성 대표 "멀티모달 RAG기술 통해 AI 기술 수준 한 단계 업그레이드"
와이즈넛 회사 전경(사진=와이즈넛 제공) *재판매 및 DB 금지


[서울=뉴시스]송혜리 기자 = 와이즈넛은 과학기술정보통신부가 주관하는 정보통신방송기술개발사업 중 정보통신기획평가원(IITP)이 추진하는 '멀티모달 데이터 입력 기반 검색증강생성 기술 개발'과제 주관사로 1차년도 연구에 착수했다고 29일 밝혔다.

오는 2027년까지 4년에 걸쳐 진행되는 이번 연구는 실제 업무환경에서 융합대 활용되는 멀티모달 데이터를 기반으로 초거대언어모델(LLM)의 구조적·성능적 한계로 제기되는 ▲최신화된 정보유지의 어려움 ▲할루시네이션 ▲도메인 정보 부족 ▲대규모 컴퓨팅자원소요 등의 한계를 극복하는 멀티모달 검색증강생성(RAG) 기술 개발을 목표로 한다.

멀티모달은 인간이 사물의 양상을 다양한 감각기관으로 받아들이는 것처럼 텍스트, 이미지, 음성, 비디오 등 다양한 형태의 데이터 채널(Modality)을 동시에 처리하는 것을 뜻한다. 이는 텍스트와 함께 소리 데이터를 융합하고 이를 분석해 소리의 크기나 성격을 더 정확하게 이해하거나, 동영상에서 얼굴 이미지를 인식하고 음성 대화를 텍스트로 변환해 자동자막을 생성하는 등 폭넓게 활용될 수 있는 만큼 새로운 대안으로 주목받는 기술이다.

와이즈넛은 이번 과제에서 멀티모달 데이터 수집 및 처리, 검색, 통합관리 기술 개발에 주력한다. 자체 보유하고 있는 LLM 기술 기반 RAG 기술을 적용해, 멀티모달 질의 이해 및 답변 생성기술부터 LLM의 성능을 높이기 위한 언어모델 최신화 기술, 효율적인 데이터 학습·관리를 위한 RAG 데이터 파이프라인 기술, 도메인 실증까지 전반의 기술 개발을 총괄 수행한다.

강용성 와이즈넛 대표는 "향후 인공지능이 인간처럼 사고하고 상호작용하기 위해서는 멀티모달 RAG기술은 필수적"이라며 "와이즈넛은 이번 연구에서 멀티모달 RAG기술을 통해 AI 기술 수준을 한 단계 업그레이드하고, 혁신적인 비즈니스 모델을 선제적으로 창출하는 기술적 토대를 마련할 것"이라고 덧붙였다.

☞공감언론 뉴시스 chewoo@newsis.com

Copyright © 뉴시스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?