신뢰 높인 ‘LG 지식형 AI’ 아니면 말고 식 답변 없다
LG가 수천만 건의 논문을 학습한 전문가용 생성형 인공지능(AI) ‘엑사원 2.0’을 공개했다. 인터넷상의 광범위한 데이터를 그대로 가져다 쓰는 방식이 아니다. AI·의학·화학 등 전문분야 논문을 학습·검색한 뒤 이에 기반한 답만 내놓는 방식으로 신뢰성을 높였다. LG는 새로운 AI를 신소재·신약 개발 등에 활용할 계획이다.
LG AI연구원은 19일 서울 LG사이언스파크에서 ‘LG AI 토크 콘서트 2023’을 열고 새로운 버전의 엑사원을 공개했다. 2021년 12월 엑사원을 처음 선보인 지 1년7개월 만이다.
엑사원 2.0은 이전 모델 대비 학습 데이터 양을 4배 이상 늘렸다. 특히 파트너십을 통해 확보한 AI·과학·바이오·기술 분야 전문문헌 4500만건과 이미지 3억5000만장을 학습했다. 전문문헌 상당수가 영어로 된 점을 고려해 엑사원 2.0을 한국어와 영어를 동시에 이해하고 답변할 수 있는 이중언어 모델로 개발했다. 특허청과의 업무협약(MOU)으로 조만간 2200만건의 특허 문서까지 학습하게 된다.
LG AI연구원은 엑사원 2.0에 기반한 전문가용 AI 챗봇 서비스 ‘엑사원 유니버스’도 선보였다. 채팅을 통해 AI로부터 답을 얻거나 정보를 검색할 수 있다는 점에서 오픈AI의 챗GPT와 유사하지만, 전문영역 채팅에 특화된 게 강점이다.
‘세종대왕 맥북 던짐 사건을 설명해달라’고 물으면, 챗GPT는 학습 데이터에 관련 내용이 없어도 질문 의도에 따라 단어를 하나씩 생성해 “15세기 세종대왕이 훈민정음 초고를 작성하던 중 신하들에게 맥북을 던진 사건”이라는 황당한 답을 내놓는다.
반면 엑사원 유니버스는 학습 데이터베이스에서 관련 문서를 탐색한 뒤 다양한 근거들을 기반으로 추론해 답변을 생성하고 출처도 제공한다.
세종대왕 맥북 던짐 사건 같은 답변할 수 없는 질문에는 “모른다”고 답하는 능력을 갖췄다.
이날 시연에서는 LG AI연구원 관계자가 엑사원 유니버스에 “대형언어모델(LLM)의 할루시네이션(잘못된 정보를 그럴듯하게 생성하는 환각현상)을 어떻게 극복할 수 있느냐”고 물었다. 엑사원 유니버스는 관련 주제를 다룬 논문 2개를 소개하고 논문 내용을 근거로 언어 데이터 외에 이미지 데이터 등을 추가로 학습시키는 방안 등 몇가지 대안을 제시했다.
배경훈 LG AI연구원장은 “(LLM의 기반이 되는) 트랜스포머 기술 특성상 할루시네이션은 반드시 발생할 수밖에 없다”며 “엑사원 2.0이 할루시네이션을 100% 해결한 건 아니지만 이런 문제를 줄이면서 동시에 근거를 명확하게 제공하는 데 주력했다”고 밝혔다.
LG AI연구원은 엑사원 2.0을 기반으로 ‘엑사원 디스커버리’와 ‘엑사원 아틀리에’ 서비스도 선보였다. 디스커버리 서비스는 화학·바이오 분야 논문을 근거로 신소재·신물질·신약 등의 구조 설계를 돕고, 합성 후 해당 물질이 어떤 성질을 띠게 되는지 등을 알려준다. 아틀리에는 디자이너 등 예술가들이 원하는 이미지를 검색·생성해주는 일종의 플랫폼 서비스다.
엑사원 2.0 서비스는 LG그룹 계열사와 협력 대학·기업 등 주로 기업 간 거래(B2B) 방식으로 활용될 계획이다.
이재덕 기자 duk@kyunghyang.com
Copyright © 경향신문. 무단전재 및 재배포 금지.
- [단독] 강혜경 “명태균, 허경영 지지율 올려 이재명 공격 계획”
- “아들이 이제 비자 받아 잘 살아보려 했는데 하루아침에 죽었다”
- 최현욱, 키덜트 소품 자랑하다 ‘전라노출’···빛삭했으나 확산
- 수능문제 속 링크 들어가니 “김건희·윤석열 국정농단 규탄” 메시지가?
- 윤 대통령 ‘외교용 골프’ 해명에 김병주 “8월 이후 7번 갔다”···경호처 “언론 보고 알아
- 이준석 “대통령이 특정 시장 공천해달라, 서울 어떤 구청장 경쟁력 없다 말해”
- “집주인인데 문 좀···” 원룸 침입해 성폭행 시도한 20대 구속
- 뉴진스 “민희진 미복귀 시 전속계약 해지”…어도어 “내용증명 수령, 지혜롭게 해결 최선”
- 이재명 “희생제물 된 아내···미안하다, 사랑한다”
- ‘거제 교제폭력 사망’ 가해자 징역 12년…유족 “감옥 갔다 와도 30대, 우리 딸은 세상에 없어