업스테이지 “국제패턴인식협회 주관 AI 경진대회 4개 부문 석권”

우수민 기자(rsvp@mk.co.kr) 2023. 4. 24. 15:42
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

“ICDAR 로버스트 리딩 컴페티션서
아마존·엔비디아 등 빅테크 제쳐”
Hierarchical 1,2 과제 대회 순위를 기록한 리더보드 순위표. [사진 제공 = 업스테이지]
AI 스타트업 업스테이지가 국제패턴인식협회인 ‘IAPR’이 시작한 국제경진대회인 ‘ICDAR 로버스트 리딩 컴페티션’ HierText-1/2, VQAonBD, IHTR 4종목에서 모두 1위를 기록했다고 24일 밝혔다.

업스테이지에 따르면 ICDAR 로버스트 리딩 컴페티션은 디지털 이미지와 비디오 상에서 텍스트를 감지·인식하는 기술인 로버스트 리딩 분야에서 가장 권위있는 국제경진대회로 꼽힌다.

업스테이지는 문자 검출 기술과 인식기술 모두에서 아마존, 엔비디아, 알리바바, 화웨이를 비롯한 빅테크 기업과 경쟁에서 가장 높은 점수를 기록했다.

20일 업스테이지가 1위를 수상한 IHTR 종목은 인도에서 쓰이는 대표 10종의 언어에 대한 글자 인식 문제를 다뤘다. 업스테이지는 단어, 줄·단락의 구조를 나타내는 계층적 주석을 제공하는 첫 번째 실제 이미지 데이터셋인 ‘HierText’를 사용해 광학문자인식(OCR)의 새로운 작업을 수행하는 ‘계층적 텍스트 감지 및 인식’ 종목에서 1위를 기록했다.

업스테이지는 문서 이미지를 주고 이미지 내 데이터의 답을 얻는 과제를 수행하는 종목인 VQAonBD에서도 2위와 높은 점수 차이로 1위를 기록했다. 예를 들면 계산이 복잡한 세금 문서를 제시한 뒤 ‘2019년의 세금 합계가 무엇이냐’와 같은 질문에 대해 정확한 답을 추출하는 것뿐만 아니라 그 값을 이용해 비율, 평균, 최소·최대값 등을 구하는 연산 작업까지 수행하는 문제도 제시됐다.

업스테이지에 따르면 기존 검출 기술은 인접한 단어 영역이 서로 겹치지 않도록 하기 위해 단어 영역을 크게 줄여 학습에 사용했다면, 회사 연구팀은 단어 영역은 조금만 줄이는 대신 단어 영역 사이 공백을 넣어 학습에 활용하며 단어 상자를 예측하는 방식으로 모델 성능을 대폭 개선시켰다.

이를 통해 이번 대회부터 신설된 평가 기준 가운데 하나인 예측된 박스와 정답 박스 사이 유사도를 크게 향상시켰다는 설명이다.

김성훈 업스테이지 대표는 “기술력이 검증된 업스테이지의 AI OCR로 문서 자동화가 필요한 전 산업의 디지털 전환과 AI 글로벌 혁신을 도울 것”이라고 강조했다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?