"상위 1% 전문가" LG, 초거대 AI '엑사원 2.0' 공개(영상)

LG AI연구원, AI 토크 콘서트 통해 '엑사원 2.0' 소개
유니버스·디스커버리·아틀리에 등 3대 플랫폼 제시

배경훈 LG AI연구원장이 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 열린 'LG AI 토크 콘서트 2023'에서 '엑사원 2.0'을 소개하고 있다. /이성락 기자

[더팩트ㅣ마곡=이성락 기자] LG가 초거대 인공지능(AI)을 선보인 지 약 1년 7개월 만에 진화된 버전인 'EXAONE(엑사원) 2.0'을 공개했다. 초거대 AI는 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 스스로 학습해 인간처럼 사고·학습·판단하는 AI를 말한다.

LG AI연구원은 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 'LG AI 토크 콘서트 2023'을 열고 초거대 멀티모달 AI '엑사원 2.0'을 소개했다. '엑사원 2.0'은 2021년 12월 첫선을 보인 '엑사원'에서 진화, 기존 대비 신뢰성을 높이고 비용을 절감하는 동시에 맞춤형 모델을 제공할 수 있다는 점이 특징이다. 그동안 LG AI연구원은 '상위 1%의 전문가 AI'를 목표로 '엑사원 2.0' 연구를 추진했다.

구체적으로 '엑사원 2.0'은 파트너십을 통해 확보한 특허, 논문 등 약 4500만 건의 전문 문헌과 3억5000만 장의 이미지를 학습했다. LG AI연구원은 현존하는 전문 지식 데이터의 상당수가 영어로 돼 있는 점을 고려해 '엑사원 2.0'을 한국어와 영어를 동시에 이해하고 답변할 수 있는 이중 언어 모델로 개발했다. 학습 데이터양도 기존 모델 대비 4배 이상 늘려 성능을 높였다.

또한, LG AI연구원은 초거대 AI의 고비용 이슈를 해결하기 위해 대규모 언어 모델(LLM)과 멀티모달 모델의 경량화, 최적화 신기술에 상당한 자원을 투입했다. '엑사원 2.0'의 언어 모델은 기존 모델과 동일한 성능을 유지하면서도 추론 처리 시간을 25% 단축하고, 메모리 사용량을 70% 줄여 비용을 약 78% 절감할 수 있다는 게 LG AI연구원의 설명이다.

언어와 이미지 간 양방향 생성이 가능한 멀티모달 모델은 이미지 생성 품질을 높이기 위해 기존 모델보다 메모리 사용량을 2배 늘렸지만, 추론 처리 시간을 83% 단축해 비용을 약 66% 절감했다.

발표자로 나선 배경훈 LG AI연구원장은 대표적인 '엑사원' 활용 사례로 LG전자의 AI컨택센터(AICC)를 제시했다. 배경훈 원장은 "AICC는 고객과의 상담 내용을 실시간으로 분석·요약하고 상담 내용에 적합한 답변이나 콘텐츠를 제안한다"며 "국내에서 시범 운영 중인 AICC를 하반기 중 정식 서비스로 전환할 예정이며, 내년부터 영어권 국가로 확대할 계획"이라고 설명했다.

이날 LG AI연구원은 '엑사원'의 3대 플랫폼인 △유니버스 △디스커버리 △아틀리에 등도 소개했다. 먼저 '엑사원 유니버스'는 △질의응답·대화 △텍스트 분류·요약 △키워드 추출·생성 △번역 등 기능별로 메뉴를 나눴던 방식에서 전문가용 대화형 AI 플랫폼으로 거듭났다. '엑사원 유니버스'는 전문성이 필요한 분야의 질문에 대해 근거에 기반한 정확한 답변을 생성한다. 사전 학습한 데이터는 물론, 각 분야 최신 전문 데이터까지 포함해 근거를 찾아내며 추론한 답변을 제시한다.

'엑사원 디스커버리'는 화학·바이오 분야 발전을 앞당길 신소재·신물질·신약 개발 플랫폼이다. 멀티모달 AI 기술을 활용해 전문 문헌의 텍스트뿐 아니라 분자 구조, 수식, 차트, 테이블, 이미지 등 비텍스트 정보까지 AI가 읽고 학습할 수 있는 형태로 데이터베이스화하는 심층 문서 이해(DDU) 기술을 적용했다.

이날 LG AI연구원은 친환경 배터리 개발에 활용할 수 있는 첨가제 소재의 개발을 주제로 '엑사원 유니버스'와 '엑사원 디스커버리'를 연계해 AI에 질문하며 △전문 문헌 검토 △분자 정보 추출 △소재 구조 설계(UMD) △소재 합성 예측(NCS) 등 후보 소재를 찾아내 합성 결과를 예측하는 과정을 시연했다. LG AI연구원은 '엑사원 디스커버리'를 통해 1만회가 넘었던 합성 시행착오를 수십회로 줄이고, 연구개발 소요 시간을 40개월에서 5개월로 단축시킬 수 있을 것으로 예상했다.

끝으로 '엑사원 아틀리에'는 이미지를 언어로 표현하고 언어를 이미지로 시각화하는 멀티모달 AI 플랫폼이다. 저작권을 확보한 이미지·텍스트가 짝을 이룬 페어 데이터 3억5000장을 학습한 '엑사원 2.0'을 기반으로 이미지 생성과 이미지 이해에 특화된 기능을 제공한다. LG AI연구원은 이날 제품 이미지를 보고 마케팅 문구 등을 생성하는 '엑사원 아틀리에'의 새로운 서비스를 시연했다. LG AI연구원은 올해 하반기 일반 대중에게 '엑사원 아틀리에'를 공개할 예정이다.

배경훈 원장은 "LG는 국내에서 유일하게 이중 언어 모델과 양방향 멀티모달 모델을 모두 상용화한 기업"이라며 "세상의 지식을 이해하고 발견하는 상위 1%의 전문가 AI를 개발하고 있다"고 말했다.

이어 "국내외 파트너사와의 협력을 통해 실질적인 성공 사례를 만들어 가며 다른 생성형 AI들과는 차별화된 고객 가치를 창출하는 글로벌 경쟁력을 갖춘 AI 컴퍼니로 발전해 나갈 것"이라고 강조했다.

rocky@tf.co.kr

발로 뛰는 더팩트는 24시간 여러분의 제보를 기다립니다.
▶카카오톡: '더팩트제보' 검색
▶이메일: jebo@tf.co.kr
▶뉴스 홈페이지: http://talk.tf.co.kr/bbs/report/write

IT/과학

"상위 1% 전문가" LG, 초거대 AI '엑사원 2.0' 공개(영상)