韓 AI 스타트업 일냈다…업스테이지, 국제 AI 경진대회 4부문 석권

남궁경 2023. 4. 24. 09:09
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AI OCR 분야 최고 권위 'ICDAR 로버스트 리딩 컴페티션' 4개부문 1위
아마존·엔비디아 등 글로벌 빅테크 모두 제쳐…2위도 업스테이지 홍콩
IHTR 순위.ⓒ업스테이지

인공지능(AI) 광학문자인식(OCR) 세계 최고 권위 대회 ‘ICDAR 로버스트 리딩 컴페티션’에서 업스테이지가 4개 부문을 석권하며 글로벌 톱 AI기술력을 뽐냈다.


업스테이지는 지난 21일 국제패턴인식협회인 ‘IAPR’이 시작한 국제 경진 대회인 ‘ICDAR 로버스트 리딩 컴페티션’ HierText-1/2, VQAonBD, IHTR 4종목에서 모두 1위를 기록했다고 24일 밝혔다.


ICDAR 로버스트 리딩 컴페티션은 디지털 이미지와 비디오 상에서 텍스트를 감지·인식하는 기술인 로버스트 리딩(Robust Reading) 분야에서 가장 권위 있는 국제경진대회다.


ICDAR는 지난 1991년을 시작으로 매년 열리는 국제 학회로 문서 분석 및 인식 분야에서 활동하는 글로벌 기업 및 연구자와 전문가들이 참여하는 국제 학회다.


OCR은 크게 이미지에서 ▲문자의 위치를 찾는 ‘검출 기술’ ▲문자가 무엇인지 알아내는 ‘인식 기술’로 나뉜다. 업스테이지는 문자 검출 기술과 인식기술 모두에서 아마존, 엔비디아, 알리바바, 화웨이 등 글로벌 빅테크 기업들과의 경쟁에서 가장 높은 점수를 기록했다.


지난 20일 업스테이지가 1위의 결과를 받은 IHTR 종목은 인도에서 쓰이는 대표 10종의 언어에 대한 글자 인식 문제를 다뤘다. 업스테이지는 글자 인식 기술을 활용하여 대회에 참가해 이전에 경험이 없던 신규 언어임에도 불구하고 최고 성능의 모델을 구축해 유의미한 성과를 거뒀다.


특히 단어, 줄 및 단락의 구조를 나타내는 계층적 주석을 제공하는 첫 번째 실제 이미지 데이터셋인 ‘HierText’를 사용, OCR의 새로운 작업을 수행하는 'Hierarchical Text Detection and Recognition’ 종목에서는 업스테이지 팀과 홍콩지사가 1위와 2위를 모두 휩쓸었다.


단순 OCR기술만으로 좋은 평가를 받을 수 없는 VQAonBD 종목에서도 업스테이지는 2위와 엄청난 점수 차이로 글로벌 톱의 성적을 거뒀다. VQAonBD는 문서 이미지를 주고 이미지 내 데이터의 답을 얻는 과제를 수행하는 종목이다. 예를 들면 계산이 복잡한 세금문서를 준 후 '2019년의 세금 합계가 뭐야'와 같은 질문에 대해 정확한 답변을 추출하는 것뿐만 아니라 그 값을 이용, 비율, 평균, 최소 최대 값 등을 구하는 연산 작업까지 수행하는 문제도 제시됐다.


특히 이번에 입상한 업스테이지 팀은 국내 유일의 캐글대회 두 자릿수 금메달에 빛나는 업스테이지 챌린지스 팀과 OCR팀이 의기투합해 구성했다. 21년과 22년 연속으로 캐글 대회에서 세계 1위와 2위를 기록하며 국내 최연소 그랜드마스터에 이름을 올린 김윤수 엔지니어를 포함, 두명의 그랜드마스터와 한명의 마스터를 보유한챌린지스 팀의 역량과 현업에서 실제 다양한 기업의 OCR 과제를 수행하고 있는 업스테이지의 우수한 연구원들이 힘을 합쳐 최고의 성과를 만들어 냈다는 평가다.


업스테이지는 이번 대회에서 우수한 성과를 받을 수 있었던 이유로 치열한 연구를 통한 새로운 방법론을 사용, 기존과 다른 방식을 활용했다고 밝혔다. 기존 검출 기술은 인접한 단어 영역이 서로 겹치지 않도록 하기 위해 단어 영역을 크게 줄여 학습에 사용했다. 업스테이지 팀은 단어 영역은 조금만 줄이는 대신 단어 영역 사이에 갭을 넣어 학습에 활용하면서 단어 상자를 예측하는 방식으로 모델 성능을 대폭 개선시켰다.


이를 통해 업스테이지 팀은 이번 대회부터 신설된 평가 기준 중 하나인 예측된 박스와 정답 박스 사이의 유사도(tightness)를 크게 향상할 수 있었다고 한다.


AI OCR 기술은 AI 기술 중에서도 디지털 전환의 기반이 되는 기술로 데이터의 디지털 자산화를 위한 고도화에 여러 기업들이 속도를 내고 있다. 업스테이지는 최고의 OCR 기술을 활용한 OCR팩을 개발, 올 초 한화생명과 삼성SDS, 포스코그룹 등 다양한 산업의 기업의 AI 혁신을 돕고 있다.


업스테이지는 이번 대회에서 기술력을 재확인한 OCR기술을 비롯, 고객 정보와 제품 및 서비스 특징을 고려한 추천 기술 등 AI 기술을 고객들이 한 번에 맞춤형으로 활용할 수 있도록 돕는 노코드-로코드 솔루션 AI팩과 이를 코드 복사만으로 편리하게 활용할 수 있는 API 시리즈를 출시, 고객사들의 AI 혁신을 돕고 있다. 업스테이지 AI팩을 이용하면 데이터 가공, AI 모델링, 지표 관리를 쉽게 활용할 수 있을 뿐 아니라 지속적인 업데이트를 지원, 상시 최신화 된 AI 기술을 편리하게 사용할 수 있다.


김성훈 업스테이지 대표는 “AI OCR 분야 최고 권위의 대회인 ‘ICDAR 로버스트 리딩 컴페티션’에서 4개 부문의 1위를 휩쓸며 다시 한 번 업스테이지가 글로벌 톱 AI기술력을 인정받아 무척 기쁘다” 며 "세계최고의 기술력이 검증된 업스테이지의 AI OCR로 문서 자동화가 필요한 전 산업의 디지털 전환과 AI 글로벌 혁신을 도울 것"이라고 말했다.


업스테이지 로고.ⓒ업스테이지

Copyright © 데일리안. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?