LG, 이미지 이해하고 설명하는 AI 키운다

‘LG 글로벌 AI 챌린지’ 개최
방대한 이미지 데이터 자동분류
의학 등 전문 분야 적용도 가능

LG AI연구원이 전 세계 인공지능(AI) 연구자를 대상으로 'LG 글로벌 AI 챌린지'를 열고, 시각 AI와 언어 AI의 융합 트렌드를 주도한다.

1월 31일 업계에 따르면 LG AI연구원은 2월 1일부터 4월 말까지 온라인으로 'LG 글로벌 AI 챌린지'를 개최한다. '제로샷 이미지 캡셔닝'을 주제로 열리는 이번 대회는 AI가 처음 본 이미지를 얼마나 정확하게 이해하고 설명하는지 평가한다.

제로샷 이미지 캡셔닝은 AI가 처음 본 사물이나, 동물, 풍경 등이 포함된 이미지를 봤을 때 기존 학습한 데이터를 기반으로 스스로 이해하고 유추한 결과를 텍스트로 설명할 수 있는 기술이다. 이 기술이 고도화되면 이미지 인식 AI 기술의 정확성과 공정성이 향상되고 결국 사람들의 실생활에 직접적으로 도움을 줄 수 있는 기술 개발로 이어질 수 있다.

일례로 온라인에 올라오는 방대한 분량의 이미지 데이터를 AI가 자동으로 캡션과 키워드를 생성해 검색의 편의성과 정확도를 향상시킬 수 있다. 또 의학 전문 데이터를 추가 학습할 경우 의학 영상을 분석하는 '의학 전문가 AI'로 활약할 수도 있다.

특히 최근 자연어 검색 분야에서 반향을 일으키고 있는 챗GPT 처럼 AI가 스스로 이미지를 이해하고 설명하며, 해시태그도 달 수 있는 이미지 캡셔닝 기술은 이미지 검색 분야에 혁신을 가져올 것으로 예상된다.

이번 경진대회는 초거대 멀티모달 AI인 '엑사원'을 연구 중인 서울대학교 AI대학원과 이미지 캡셔닝 AI 사용화 서비스를 공동으로 준비 중인 셔터스톡이 함께 한다. 셔터스톡은 편향성과 선정성 등에 대한 AI 윤리 검증을 끝낸 고품질 이미지-텍스트 데이터셋 2만6000개를 무료로 제공한다.

파이낸셜뉴스

보도자료

LG, 이미지 이해하고 설명하는 AI 키운다