LG, '챗GPT' 압도할 초거대 AI 내놨다
산업계 넘어 일반 서비스까지 진출 예정
언어와 이미지를 이해·생성하고 전문 문헌까지 이해할 수 있는 생성형 AI를 만들어가는 기업은 한국에서 LG AI연구원이 유일하며, 전 세계적으로도 손꼽을 수 있다고 자부합니다.
LG가 한 단계 진화한 초거대 멀티모달(Multimodal) AI '엑사원 2.0'을 공개했다. 엑사원 2.0을 적용해 기존 공개했던 '3대 플랫폼'도 개선했다. 언어모델 기반 플랫폼인 유니버스(Universe)는 대화형 AI(인공지능) 플랫폼으로 탈바꿈했고, 개발 플랫폼인 디스커버리(Discovery)도 처음으로 구체화했다.
LG는 새 버전 공개를 시작으로 엑사원의 전문 산업 분야 활용도를 점차 높여갈 계획이다. 기존까지는 산업용 서비스를 중심으로 했다면, 향후 멀티모달 AI 플랫폼인 엑사원 '아틀리에'를 중심으로 소비자 대상 AI 서비스도 준비 중이다.
4배 많은 전문 데이터로 신뢰도 향상
19일 LG AI연구원은 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 'LG AI 토크 콘서트 2023'을 열고 엑사원 2.0을 처음으로 소개했다. 지난 2021년 12월 엑사원을 처음 선보인 이후 약 1년 7개월 만이다.
엑사원 2.0은 기존 모델 대비 학습 데이터 양을 4배 이상 늘려 성능을 향상한 것이 특징이다. 파트너십을 통해 확보한 특허, 논문 등 약 4500만건의 전문 문헌과 3억5000만장의 이미지를 학습했다. 특히 이 데이터는 모두 저작권, 신뢰성 등 AI 윤리원칙에 기반해 있다.
배경훈 LG AI연구원장은 "지난 6개월간 AI 산업은 엄청난 변화를 겪으며 기존과는 차원이 다른 새로운 경험을 제공해주고 있지만, 실제 산업 현장에서는 현재의 생성형 AI에 만족하고 있지 않다"며 "생성되는 결과에 대한 신뢰도가 높지 않고 많은 비용이 발생할 수밖에 없으며 기업 내부 데이터 유출에 대한 우려가 있기 때문"이라고 설명했다.
이어 "이런 문제를 해결하기 위해 LG AI연구원은 학습 데이터 품질 강화에 집중하고 전문 데이터 중심으로 고품질의 데이터를 확보해왔다"면서 "데이터 확보 시 모든 저작권, 개인정보 이슈를 해결하고 학습을 진행했다"고 밝혔다.
또 초거대 AI의 고비용 문제를 해결하기 위해 대규모 언어 모델(LLM)과 멀티모달 모델의 경량화, 최적화 신기술에 상당한 자원을 투입했다는 게 LG AI연구원 측의 설명이다. 메모리 사용량을 줄이고 추론 처리 속도를 높여 경제성을 높였다.
엑사원 2.0 언어 모델의 경우 기존 모델과 동일한 성능을 유지하면서도 추론 처리 시간은 25% 단축했다. 메모리 사용량은 70% 줄여 비용을 약 78% 절감했다. 멀티모달 모델은 이미지 생성 품질을 높이기 위해 기존 모델 대비 메모리 사용량을 2배 늘렸다. 추론 처리 시간도 83% 단축해 약 66%의 비용 절감을 달성했다.
고객의 니즈와 활용 목적에 따라 맞춤형 모델로 제공해 편의성도 높였다. 고객들은 엑사원 2.0을 원하는 용도나 예산에 맞게 모델의 크기부터 종류(언어·비전·멀티모달), 사용 언어까지 맞춤형으로 설계할 수 있다.
배 원장은 "커스텀 방식은 도메인별 전문성을 유지하고 내부 데이터 보안 우려를 해소할 수 있어 전문 산업 분야에서 엑사원의 활용도가 크게 높아질 것으로 기대하고 있다"고 말했다.
엑사원 2.0은 현재 LG전자의 AICC(AI Contact Center, AI 컨택 센터)에서 시범 운영 중이다. AICC는 고객과의 상담 내용을 실시간으로 분석·요약하고 상담 내용에 적합한 답변이나 콘텐츠를 제안한다. LG AI연구원은 하반기 중 AICC를 정식 서비스로 전환할 예정이다. 내년부터 영어권 국가로 확대할 계획이다.
'기업에서 소비자까지' 활용 범위 확대
이날 LG AI연구원은 '전문가 AI' 서비스 개발의 기반인 엑사원 3대 플랫폼 △유니버스 △디스커버리 △아틀리에도 소개했다.
엑사원 유니버스는 언어모델을 기반으로 질문에 대한 전문적 답변을 생성하고, 최신 기술을 연구하거나 기업의 전문 업무를 도와주는 플랫폼이다. 특히 엑사원 유니버스는 엑사원 2.0을 적용하며 전문가용 대화형 AI 플랫폼으로 개선됐다. 기존까지 엑사원 유니버스는 △질의응답·대화 △텍스트 분류·요약 △키워드 추출·생성 △번역 등 기능별로 메뉴를 나눴다. 이번 버전에서는 챗GPT와 같은 대화형으로 변경해 사용성을 높였다.
각 분야의 전문가들이 믿고 활용할 수 있도록 하기 위해 전문성과 신뢰성도 높였다. 최근 화제가 된 챗GPT 등 AI 언어 모델은 '할루시네이션(환각·환영)' 문제를 안고 있다. 출처가 분명하지 않거나 가짜뉴스로 데이터를 학습하면, 사실이 아닌 것도 사실처럼 이야기해 정보의 진위를 가릴 수 없다.
이에 비해 엑사원은 산업 분야의 전문적인 데이터를 학습하고, 질문에 답변할 때 근거도 명시한다. 엑사원 유니버스에 질문을 던지면, 그에 대한 답변과 함께 화면 좌측과 우측에 각각 질문과의 연관성이 가장 높은 전문 문헌들과 AI가 답변하는 과정에서 활용한 단락을 표시한다.
엑사원 유니버스의 첫 전문영역은 AI·머신러닝 분야다. 오는 31일부터 LG그룹 내 AI 연구자, 협력 중인 대학을 대상으로 서비스를 시작한다. 오는 9월에는 LG에서 AI를 연구하거나 공부하는 임직원 대상으로 정식 서비스를 진행할 계획이다. 이어 화학, 바이오, 제약, 의료, 금융, 특허 등 엑사원 유니버스의 각 전문 도메인별 특화 서비스도 준비하고 있다.
엑사원 디스커버리는 새로운 지식을 발견하는 플랫폼이다. 논문과 특허 등 전문 문헌의 텍스트뿐만 아니라 분자 구조·수식·차트·테이블·이미지 등 비(非)텍스트 정보까지 AI가 읽고 학습하고, 이를 데이터베이스화하는 심층 문서 이해(DDU, Deep Document Understanding) 기술이 적용돼 있다.
LG AI 연구원은 엑사원 디스커버리를 신소재·신물질·신약 관련 탐색에 가장 먼저 적용했다. 이날 LG AI 연구원은 엑사원 디스커버리를 처음으로 시연하기도 했다. 친환경 배터리 개발에 활용할 수 있는 첨가제 소재의 개발을 주제로 △전문 문헌 검토 △분자 정보 추출 △소재 구조 설계 △소재 합성 예측 등 후보 소재를 찾아내 합성 결과를 예측하는 과정을 보여줬다. LG AI연구원은 올해 4분기에 그룹 내 화학 및 바이오 분야 연구진들을 대상으로 엑사원 디스커버리 서비스를 제공할 예정이다.
엑사원 아틀리에는 이미지를 언어로 표현하고, 언어를 이미지로 시각화할 수 있는 멀티모달 AI 플랫폼이다. 창의적 영감과 아이디어에 도움을 주기 위해 개발됐다. 예를 들어 제품 이미지를 넣은 후 이에 맞는 마케팅 문구를 만들어 달라고 요청하면, 엑사원 아틀리에는 이미지를 이해해 적합한 마케팅 문구를 생성한다.
LG AI연구원은 올 3분기에 그룹 내외부의 전문 디자이너를 대상으로 엑사원 아틀리에 서비스를 시작한다. 특히 산업계가 아닌 일반 소비자가 활용할 수 있도록 B2C(소비자 간 거래) 서비스도 공개할 계획이다.
배 원장은 "일반 소비자들이 SNS를 올릴 때 적절한 문구를 생성하는 용도로 엑사원 아틀리에를 유용하게 사용할 수 있을 것 같아 일부 B2C 서비스를 진행할 계획"이라며 "계열사와 협력해 비즈니스 모델을 만들고 있다"고 말했다. 초기에는 시장 확대를 위해 무료로 공개하고 추후 수익화를 위해 유료로 전환할 계획이다.
이어 그는 "국내외 파트너사와의 협력을 통해 실질적인 성공 사례를 만들어가며 '다른 생성형 AI들과는 차별화된 고객 가치'를 창출하는 글로벌 경쟁력을 갖춘 AI 컴퍼니로 발전하겠다"고 강조했다.
백유진 (byj@bizwatch.co.kr)
ⓒ비즈니스워치의 소중한 저작물입니다. 무단전재와 재배포를 금합니다.
Copyright © 비즈워치. 무단전재 및 재배포 금지.