"'엑스퍼트AI'로 AI 새 패러다임 열어···멀티모달 선두 질주"

[7회 디지털미래혁신대전-과기정통부 장관상] LG AI연구원

(지디넷코리아=방은주 기자)"LG AI연구원은 최신AI 기술 연구에서 업계를 선도하고 있을 뿐 아니라 언어와 이미지를 이해하는 기술에서 나아가 문서까지 이해하는 멀티모달 생성형AI로 혁신을 만들어 가고 있습니다. 이번 대상 수상으로 이런 노력을 인정받게 돼 기쁘게 생각합니다. 앞으로도 인간을 돕는 'Expert AI'를 개발하고 AI 생태계 확장을 위해 더욱 고민하고 노력하겠습니다."

과학기술정보통신부(과기정통부)와 지디넷코리아가 주최하고 한국소프트웨어산업협회(회장 조준희)가 주관한 '제 7회 대한민국 디지털 미래혁신 대상'에서 영예의 대상인 과기정통부 장관상을 수상한 LG AI연구원(원장 배경훈)은 이 같은 수상 소감을 밝혔다.

LG AI연구원은 2020년 12월 LG 그룹의 AI역량 강화를 목표로 설립됐다. 최신AI 연구 와 전파, 계열사 난제 해결, AI인재 육성 등의 활동을 중점 추진한다. AI기술을 발전시켜 고객이 더 나은 삶을 추구할 수 있도록 한다는 비전을 갖고 있다.

연구원이 이번에 장관 상을 받은 '엑사원 인사이트(EXAONE Insight)'는 LG의 초거대AI인 '엑사원(EXAONE)'을 기반으로 만든 AI기반 이미지 이해 서비스다. 여러 주목할만한 특장점을 갖고 있다.

첫째, 3억5000만장의 '이미지-텍스트' 쌍 데이터를 사용한 시각 정보 처리 기술이다. '이미지-텍스트' 간 양방향 생성(이미지를 보고 이를 설명하는 텍스트를 생성하거나 반대로 텍스트의 의미를 이해해 이미지를 생성)이 가능하며, 미국 셔터스톡과 파트너십을 구축해 학습 이미지 데이터 저작권에 문제가 없다는 것이 타 모델과 차별화한 장점이다. 사회적 편향 및 선정적인 콘텐츠에 대한 검증도 철저히 거쳤다. 또 실사 이미지 뿐 아니라 일러스트레이션, 그래픽스 등 다양한 스타일의 '이미지-텍스트' 생성이 가능하다.

배경훈 LG AI연구원장이 19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 'AI 토크 콘서트'에서 신제품인 '엑사원 2.0'을 발표하고 있다.

둘째, 글로벌 AI연구 및 사업화 트렌드는 이미지 생성에 집중하고 있는데 LG는 초기부터 이미지 생성과 이미지 이해가 양방향으로 가능한 '엑사원(EXAONE) 멀티모달' 모델을 개발해 글로벌 학회에서 독창성을 인정받았다. 특히 이미지 캡션(설명) 정답과 예측값 유사도를 평가하는 CIDEr* 지표에서 기존 최고 점수인 21.4점을 뛰어넘는 35.3점을 기록하는 등 이미지 이해 성능에서 글로벌 최고 수준을 달성했다.

*CIDEr: Consensus-based Image Description evaluation: 특정 이미지에 대해 AI가 생성한 문장과 인간이 생성한 문장이 얼마나 일치하는지를 나타내는 대표적인 척도로 높을수록 유리

셋째, 일반영역에서 전문영역까지 다양하게 사용이 가능하다. 예컨대 일반영역에서는 이미지 검색, SNS 문구 작성, 요리 레시피 생성 등 일상 생활에서 폭넓게 사용할 수 있다. 또 전문 영역에서는 신소재 및 신물질 발굴, 기업 내부 문서 이해 기반 정확한 답변, 의료 이미지 분석 등이 가능하다.

LG AI연구원은 지난 6월 세계적 컴퓨터 비전 학회인 'CVPR 2023'에서 이미지 이해 분야 학습 및 테스트 데이터 셋을 공개해 성능 경쟁을 벌이는 '제로 샷 이미지 캡셔닝(Zero-shot Image Captioning) 챌린지'를 주최하는 등 글로벌 AI연구도 선도하고 있다.

'엑사원 인사이트(EXAONE Insight)' 같은 AI 기반 이미지 이해 서비스는 시장이 아직 초기 단계다. 무한한 가능성이 있는 미개척 지대로 국내외 시장 규모를 정확히 파악하기는 어렵다. 배경훈 LG AI연구원장은 "초거대 AI 기반 이미지 이해 기술은 새로운 시대를 앞당기는 핵심 돌파구가 될 것"이라면서 "LG AI연구원은 이 분야에서 세계 최초로 상용화를 이뤄냄으로써 기술력 우위를 입증했다. 이 기술은 앞으로 의료, 보안, 자동차, 공공 인프라 관리 등 다양한 분야에 활용돼 새로운 서비스 출현을 촉진할 것이다. 현재 글로벌 경쟁업체들도 같은 기술을 상용화하기 위해 열심히 노력 중이지만, 아직까지 LG 기술력이 압도적으로 앞서 있는 상황"이라고 강조했다.

LG AI연구원은 '엑사원 인사이트(EXAONE Insight)'를 지난 4월 글로벌 최대 이미지 보유 기업 미국 셔터스톡에 공급했고, 글로벌 고객사 10곳을 대상으로 시범 운영도 하고 있다. 지난 6월에는 세계최대 문헌 보유 전문기업 네덜란드 엘스비어와 호주 멜버른 대학교가 공동 주관한 화학분야 정보분석 국제 챌린지 'ChEMU*'에 정확도 기준 최대 96.7%를 획득, 참가 영역(5개 영역 중 2개 영역 참가)에서 1위를 차지했다.

*ChEMU:CheminformaticsElsevierMelbourneUniversities: 총 5가지 영역에서 경쟁하는데 이 중 LG AI는 화학 반응을 설명하는 화학 물질과 수치 정보 등의 엔터티(Entity)를 추출하는 업무(Task)와 화학 반응을 설명하는 트리거 워드(Trigger word)를 추출하고 추출한 트리거 워드와 엔터티 워(Trigger word)와 엔터티 간 관계(Relation)를 도출하는 업무 등 2개 업무 영역에 참가해 1위 달성

LG AI연구원의 AI는 '이미지-텍스트' 간 양방향 생성이 큰 특징이다. 이미지를 보고 이를 설명하는 텍스트를 생성하거나 반대로 텍스트의 의미를 이해해 이미지를 생성한다.

배 원장은 "LG의 AI 기술은 이미지 이해를 넘어 전문 문서까지도 이해하는 혁신적인 기술로 최고의 경쟁력을 인정받았다"며 "향후 이들 분야의 시장도 함께 개척할 예정"이라고 말했다.

LG AI연구원은 '특허 경영'에도 앞장서고 있다. 수상작과 관련해 지난해 11월 '이미지 텍스트 양방향 생성 장치, 방법 및 프로그램'으로 특허를 출원했다. 이 기술은 비전과 언어 간 상관관계를 찾기 위해 비전과 언어 간 양방향적 멀티모달 표현을 학습한 AI모델로, 이미지에서 텍스트, 텍스트에서 이미지로의 자유로운 전환을 가능하게 하며, 추가적인 파인튜닝(세부학습) 없이도 이미지에 대해 자세한, 때로는 사람이 만든 것보다 더 상세한 텍스트 생성을 가능하게 해준다고 회사는 설명했다. 이 외에도 LG AI연구원은 언어, 비전, 초거대AI 등 다양한 분야에서 핵심 AI 기술에 대해서 국내외에 다수의 특허를 출원했다.

LG는 'Expert AI'를 추구한다. 이는 고도의 성능과 높은 정확도를 극대화해 전문가를 돕는 인공지능을 말한다. 특정 분야에 깊이를 가진 버티컬 서비스를 개발하고, LG 계열사와 전문 파트너사를 대상으로 우선적으로 서비스를 제공하는 한편 협업 영역을 점차 넓혀갈 계획이다. 현재, LG의 이미지 이해 서비스는 세계 최대 이미지 플랫폼 기업 셔터스톡의 일부 기업 고객이 사용하고 있는데, 향후 셔터스톡의 모든 기업 고객으로 확대하는 한편 이미지 관련 유사 업체들에게도 이 서비스를 제공할 방침이다. 회사는 "이미지 이해 기술을 다른 분야에 활용해 기존에 불가능한 일들을 가능하게 하는 목표를 갖고 있다"고 설명했다.

회사는 자사 AI기술이 의료분야에서도 기존AI 기술에 비해 10% 데이터만을 활용해 더 정확한 병변을 예측하는 성능을 보였다면서 이를 통해 진단 정확도는 물론 환자들에게 더 빠른 치료 기회를 제공할 것이라고 밝혔다. 새로운 서비스도 준비중이다. 예컨대 기업 내부의 다양한 그림과 표, 그래프를 이해하고 이를 언어 모델과 결합해 기업 내부 문서에 대한 정확한 답변을 제공하는 서비스를 선보일 예정이다.

LG가 추구하는 'Expert AI'는 AI의 새로운 패러다임을 제시한다는 목표를 담고 있다. 단순히 AI가 일상생활을 도와주는 도구가 아닌, 전문적인 능력을 갖춘 신뢰할 수 있는 파트너 역할을 수행한다는 것이다. 예컨대, 'ExpertAI'는 전문가들이 그들의 전문성을 보다 발휘할 수 있게 도와주고, 비전문가에게는 전문가처럼 일할 수 있게 도와준다.

회사는 "LG는 AI 도움으로 인간이 보다 본질적이고 창조적인 업무에 집중할 수 있게 하고 싶다. 우리가 직면한 문제를 보다 깊이 생각하고, 창의적 해결책을 제시하는데 집중할 수 있도록 돕고 싶다"면서 "LG의 '엑스퍼트 AI'는 우리가 일상에서나 업무에서 진정한 의미의 자아실현을 이루는 데 도움을 주는 AI시대를 만들어 나가는 데 중심 역할을 할 것이다. 이것이 바로 LG가 추구하는 AI의 가치와 목표"라고 강조했다.

기업문화와 관련해 회사는 "다양한 배경과 경험을 가진 우수한 AI인재들이 모여 서로 협력해 최신 AI기술을 연구하고, 이를 응용해 난제를 해결하기 위한 방안을 개발하며 최고의 성과를 창출하고 있다"면서 "특히 창의적 사고와 혁신적인 아이디어를 끊임없이 추구하며, 이를 통해 우리가 직면한 복잡한 문제들에 대해 새롭고 효과적인 해결책을 찾아내는 데 가치를 두고 있다"고 설명했다.

배경훈 LG AI연구원장이 올 3월 열린 오픈커뮤니케이션 행사에서 연구원들과 이야기를 하고 있다.

이어 "이 모든 것이 가능한 이유는 상상력에 제한을 두지 않는 자유로운 연구 분위기 덕분이며, 이 역시 우리 연구원의 핵심 가치 중 하나"라면서 "개인의 창의성과 독창성을 존중하며, 각각의 아이디어가 존중받고 발전할 수 있는 공간을 제공하고 있다. 그리고 혁신적이고 도전적인 접근 방식과 새로운 연구 방법론을 지향하며, 실패도 중요한 과정으로 인정한다"고 덧붙였다.

배 원장은 "우리 목표는 AI연구의 경계를 끊임없이 밀어내는 것"이라면서 "우리는 계속해서 변화하고 진화하며, 기존 AI연구 패러다임을 뛰어넘어 미지의 영역을 탐색한다. 이것이 바로 LG AI연구원에 훌륭한 인재들이 모이는 이유"라고 밝혔다.

방은주 기자(ejbang@zdnet.co.kr)

이 기사에 대해 어떻게 생각하시나요?

지디넷코리아에서 직접 확인하세요. 해당 언론사로 이동합니다.

IT/과학

"'엑스퍼트AI'로 AI 새 패러다임 열어···멀티모달 선두 질주"