신약 개발에 말도 알아들고 거짓말 줄어…진화한 LG AI '엑사원'(종합)
3가지 플랫폼 통해 다양한 분야 전문가 활용…"그룹 연구진 등에 제공 예정"
(서울=뉴스1) 김민성 기자 = #. AI에 LG전자 공기청정기인 퓨리케어 이미지를 넣고 'LG 제품 광고를 위한 마케팅 문구를 생성해줘'라고 입력했다. 그러자 5초도 지나지 않고 "LG 퓨리케어로 공기의 힘을 믿으세요. 생활 공간을 건강하고 쾌적하게 만들어 드립니다", "실내 환경에 숨 쉬는 자유를 선사하는 LG 퓨리케어"라는 그럴싸한 광고문구를 만들어냈다.
LG가 2021년 첫 선을 보였던 초거대 AI(인공지능) '엑사원'에서 한 단계 진화된 '전문가 AI' 엑사원 2.0을 선보였다. 기존 AI가 텍스트를 분석해 이미지를 찾는 수준이었다면 엑사원은 방대한 데이터를 습득해 이해하는 수준을 넘어 논문을 분석하고 광고 카피까지 창작하는 역할도 할 수 있다. 엑사원 2.0은 기업 간 거래(B2B)와 업종별로 특화된 서비스를 제공할 예정이다.
LG(003550) AI연구원은 19일 서울 강서구 마곡 LG 사이언스파크에서 'LG AI 토크 콘서트 2023'을 열고 '엑사원 2.0'을 공개했다. 4500만건의 전문 문헌과 3억5000만장의 이미지를 학습한 엑사원 2.0은 전문성과 신뢰성이 대폭 강화된 AI로 평가받는다.
초거대 AI는 대용량의 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 스스로 학습해 인간처럼 사고·학습·판단할 수 있는 AI를 뜻한다. 특정 용도에 국한되지 않고 다양한 분야에서 활용될 수 있다. LG가 개발한 초거대 AI 엑사원은 '인간을 위한 전문가 AI'라는 뜻의 'EXpert Ai for everyONE'의 줄임말이다.
◇ 2021년 첫 선 이후 전문성·신뢰성 대폭 보강
2021년 12월 엑사원을 처음 선보였던 LG AI연구원은 각 분야에 특화된 전문가 AI 개발을 위해 연구개발을 이어왔다. 엑사원 2.0은 한국어와 영어를 동시에 이해하고 답변하는 '이중 언어 모델'로 개발했고 학습 데이터양도 기존 모델보다 4배 이상 늘렸다.
막대한 비용이 드는 초거대 AI 개발 단계에서 비용 절감을 위해 대규모 언어 모델(LLM)과 멀티모달 모델의 경량화 등에 초점을 맞췄다는 게 LG 측의 설명이다.
LG AI연구원에 따르면 엑사원 2.0의 언어 모델은 기존 모델보다 추론 시간은 25% 단축하고 메모리 사용량도 70% 줄여 총 비용을 약 78% 절감했다. 언어와 이미지가 양방향 생성이 가능한 멀티모달 모델은 메모리 사용량이 2배가 늘었지만 추론 시간은 83% 단축해 비용을 66% 줄였다.
배경훈 LG AI연구원장은 "엑사원은 전문성, 신뢰성을 바탕으로 글로벌 최고의 경쟁력을 만들고 산업 현장에서 생성형 AI가 성공하는 사례도 만들겠다"고 강조했다.
배 원장은 AI 연구뿐 아니라 앞으로 사업화를 통해 이익을 창출할 수 있느냐에 대해서도 고민하고 있다. 그는 "연구원 내 대규모 사업 조직은 없지만 LG그룹 계열사들과 함께 사업화를 추진하고 있다"며 "계열사를 통해 B2C(기업대 고객) 서비스도 제공할 수 있다"고 말했다. AI연구원이 엑사원 모델을 계열사에 전달하면, 계열사가 직접 각 업황에 맞게 사업화 방향을 잡는 것이다.
LG AI연구원은 이날 엑사원 3대 플랫폼 △유니버스 △디스커버리 △아틀리에를 차례로 공개했다.
◇ 환각현상 최소화…최신 논문 학습하고 신약 개발도 뚝딱
전문가용 대화형 AI 플랫폼인 '엑사원 유니버스'는 다른 대화형 AI와 달리 사전 학습한 데이터는 물론 도메인별 최신 전문 데이터까지 포함해 근거를 찾아 답변을 만든다. 질문에 대한 답변과 함께 화면 좌측, 우측에 각각 질문과 연관성이 가장 높은 전문 문헌과 AI가 답변하는 과정에서 활용한 단락까지 표시한다. 텍스트로만 질문이 가능한 생성형 AI 챗GPT와 달리 음성인식이 가능하다.
AI의 최대 맹점으로 꼽히는 '환각 현상'(허구를 진실처럼 대답하는 현상)을 최소화한 것도 특징이다. 데이터베이스 내에서 관련 있는 문서를 파악하고, 사실을 바탕으로 추론해 신뢰할 수 있는 답변을 한다는 게 LG 측의 설명이다.
LG는 '엑사원 유니버스'의 AI·머신러닝 분야 서비스를 오는 31일부터 그룹 내 연구자, 협력 대학을 대상으로 시작할 예정이다. 9월엔 AI를 연구하거나 공부하는 임직원에게 정식 서비스할 계획이다. 배 원장은 "유니버스는 관련 연구자들이 대부분 사용하도록 공개할 예정"이라고 말했다.
'엑사원 디스커버리'는 신소재, 신물질, 신약 개발 등에 쓰일 예정이다. 논문 등 전문 문헌의 텍스트뿐 아니라 분자 구조, 수식, 차트 등 비(非) 텍스트 정보까지 AI가 학습할 수 있도록 '심층 문서 이해 기술'을 적용했다. 신약 등 연구개발 소요 기간도 40개월에서 5개월로 대폭 단축시킬 수 있을 것으로 보고 있다. 1만회 정도의 시행착오를 수십회 수준으로 줄여주는 등 과학자들의 실험 리스크도 줄일 수 있다. 올해 4분기에 LG그룹 내 화학, 바이오 분야 연구진에게 '엑사원 디스커버리'를 제공할 예정이다.
'엑사원 아틀리에'는 이미지를 언어로 표현하고, 언어를 이미지로 시각화할 수 있는 플랫폼이다. 저작권이 확보된 이미지와 텍스트가 짝을 이룬 '페어 데이터' 3억5000만장을 학습한 엑사원 2.0을 기반으로 만들어졌다.
연구개발 과정에서 미국 파슨스 디자인 스쿨과 공동 작업을 했고 지난 6월엔 미국의 이미지·영상 플랫폼 '셔터스톡'과 협업으로 스스로 이미지를 인식해 설명하는 '캡셔닝 AI' 기능도 탑재했다. 배 원장은 "저작권 문제가 되는 데이터를 제외했다"며 "앞으로 "아틀리에는 앱을 만들어서 완성된 형태의 서비스까지 제공하는 방안을 고민하고 있다"고 말했다.
ms@news1.kr
Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.
- "성관계 안한지 몇년"…전현무, 결혼 관련 숏폼 알고리즘 들통
- 홍준표 "이재명에 징역 1년 때린 대단한 법관, 사법부 독립 지켜" 극찬
- 서점서 쫓겨난 노숙자 부른 직원 "다 못 읽으셨죠? 선물"…20년 후 반전
- "제일 큰 존재"…'사혼' 박영규, 54세 나이차 막둥이 딸 최초 공개
- "울고 있는 내 모습이"…슈, 또 눈물 뒤범벅 오열
- '이나은 옹호 사과' 곽튜브, 핼쑥해진 외모 자폭 "다른 이유 때문"
- 실종됐다는 5세 아동, 알고 보니 진돗개 숭배 사이비 단체 범행
- 배다해, ♥이장원과 결혼 3주년 자축 "지금처럼만 지내자 여보" [N샷]
- "로또 1등 당첨돼 15억 아파트 샀는데…아내·처형이 다 날렸다"
- "자수합니다"던 김나정, 실제 필로폰 양성 반응→불구속 입건(종합)