이미지 설명하고 해시태그까지… LG ‘캡셔닝 AI’ 개척

장병철 기자 2023. 1. 31. 11:57
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

LG그룹의 초거대 인공지능(AI) 개발을 주도하고 있는 LG AI연구원이 이미지를 이해하고 설명할 수 있는 '이미지 캡셔닝' 기술 분야로 연구 영역을 빠르게 확장한다.

LG는 최근 대화형 AI 챗봇인 '챗GPT'가 자연어 검색 분야에서 큰 반향을 일으킨 것처럼 AI가 스스로 이미지를 이해하고 해시태그까지 달 수 있는 '이미지 캡셔닝' 기술이 이미지 검색 분야에 혁신을 불러올 것으로 기대하고 있다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

■ 4월말까지 세계 대회 개최
기존 학습한 데이터 기반으로
처음 본 이미지 설명 정확도 평가
의학 영상분석 등 활용 무궁무진
6월 세계적 권위 학회서 워크숍

LG그룹의 초거대 인공지능(AI) 개발을 주도하고 있는 LG AI연구원이 이미지를 이해하고 설명할 수 있는 ‘이미지 캡셔닝’ 기술 분야로 연구 영역을 빠르게 확장한다. LG는 최근 대화형 AI 챗봇인 ‘챗GPT’가 자연어 검색 분야에서 큰 반향을 일으킨 것처럼 AI가 스스로 이미지를 이해하고 해시태그까지 달 수 있는 ‘이미지 캡셔닝’ 기술이 이미지 검색 분야에 혁신을 불러올 것으로 기대하고 있다.

LG AI연구원은 초거대 AI ‘엑사원(EXAONE)’을 공동 연구하고 있는 서울대 AI대학원, 이미지 캡셔닝 AI의 상용화 서비스를 함께 준비하고 있는 셔터스톡과 오는 2월 1일부터 4월 말까지 전 세계 AI 연구자를 대상으로 ‘LG 글로벌 AI 챌린지’를 연다고 31일 밝혔다.

‘LG 글로벌 AI 챌린지’는 ‘제로샷 이미지 캡셔닝(Zero-Shot Image Captioning)’을 주제로 AI가 처음 본 이미지를 얼마나 정확하게 이해하고 설명하는지를 평가하는 세계 최초의 대회다. ‘제로샷 이미지 캡셔닝’은 마치 사람의 시각 인지 능력처럼 AI가 처음 본 사물이나 동물, 풍경 등이 포함된 이미지를 보거나 삽화, 그래픽 등 표현 방식이 다른 이미지를 봤을 때 기존 학습한 데이터를 기반으로 스스로 이해하고 유추한 결과를 텍스트로 설명할 수 있는 기술을 뜻한다. 예컨대 토끼를 한 번도 본 적이 없는 사람이 토끼 여러 마리와 고양이 한 마리가 함께 있는 것을 봤을 때 ‘토끼도 털은 있지만, 고양이와는 다르게 귀가 길고, 뒷다리가 발달했다’고 설명할 수 있는 것처럼 ‘제로샷 이미지 캡셔닝’의 작동 구조도 이와 비슷하다.

연구원은 ‘제로샷 이미지 캡셔닝’ 기술이 고도화하면 사람들의 실생활에 직접 도움을 줄 수 있는 기술 개발로 이어질 것으로 보고 있다. 연구원 관계자는 “AI가 자동으로 캡션과 키워드를 생성해 검색의 편의성과 정확도를 높일 수 있다”며 “의학 전문 데이터를 추가로 학습할 경우 의학 영상을 분석하는 ‘의학 전문가 AI’로 활약할 수도 있을 것”이라고 설명했다.

LG AI연구원은 올해 6월 캐나다 밴쿠버에서 열리는 컴퓨터 비전 분야 세계 최고 권위 학회인 ‘CVPR 2023’에서 ‘제로샷 이미지 캡셔닝 평가의 새로운 개척자들’을 주제로 워크숍도 진행할 예정이다. ‘LG 글로벌 AI 챌린지’ 최종 수상팀은 이날 행사에서 성과를 발표할 기회가 주어진다. 이경무 서울대 AI대학원 석좌교수는 “세계 최초로 제로샷 이미지 캡셔닝 대회와 워크숍을 진행하는 것은 우리나라의 AI 역량이 이미 세계적인 수준에 도달했다는 것을 의미한다”고 말했다.

장병철 기자 jjangbeng@munhwa.com

Copyright © 문화일보. 무단전재 및 재배포 금지.