업스테이지, 신규 AI 문서처리 모델 공개…AWS, MS보다 5% 뛰어나
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
업스테이지가 빠르게 문서를 분석해 대규모 언어 모델(LLM)로 처리가 가능한 차세대 OCR 모델을 공개했다고 17일 밝혔다.
업스테이지가 신규 공개한 OCR 모델 '도큐먼트 파스(Document Parse)'는 기존 OCR 기술에서 명확한 인식이 어려웠던 여러 열의 레이아웃이나 테이블 등을 포함한 복잡한 형태의 문서에서도 각 구조와 텍스트 정보를 정확히 분석, 데이터 자산화를 가능하게 한다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

업스테이지가 빠르게 문서를 분석해 대규모 언어 모델(LLM)로 처리가 가능한 차세대 OCR 모델을 공개했다고 17일 밝혔다.
업스테이지가 신규 공개한 OCR 모델 '도큐먼트 파스(Document Parse)'는 기존 OCR 기술에서 명확한 인식이 어려웠던 여러 열의 레이아웃이나 테이블 등을 포함한 복잡한 형태의 문서에서도 각 구조와 텍스트 정보를 정확히 분석, 데이터 자산화를 가능하게 한다. 다양한 형식의 문서를 HTML과 같은 구조화된 텍스트 형식으로 전환해 기업이나 기관에서 실제 LLM 활용 시 바로 적용할 수 있다. 업스테이지 측은 "이 모델을 통해 데이터 전처리 과정에서의 정확성뿐만 아니라 속도와 사용성 측면에서도 현재 가장 진보한 형태의 문서 처리 기술을 선보이게 됐다"고 강조했다.
업스테이지는 관련 기술의 성능 측정에 통용될 수 있는 객관적 기준 마련을 위해 문서 구조 분석 벤치마크인 DP-Bench도 함께 공개했다. 결과에 따르면 도큐먼트 파스는 레이아웃 및 테이블 구조, 콘텐츠 분석 등 정확성을 측정하는 주요 지표에서 AWS와 MS 를 포함한 빅테크 5개사의 관련 서비스와 비교해 5% 이상 높은 점수를 받았다. 속도 면에서도 1분에 100장을 처리했다.같은 기준을 적용한 AWS 텍스트트랙보다는 10배, 라마 파스보다는 5배 가량 빠른 능력을 보였다.
수식 인식 및 이미지 추출과 같은 새로운 기능도 추가했다. HTML 외에도 헤더 및 테이블 요소를 마크다운 형식으로 제공해 LLM 사용자가 입력 문서의 토큰 크기를 줄일 수 있다. 김성훈 업스테이지 대표는 “각 기업이 가진 기존 문서를 가장 정확하게 자산화시켜 LLM을 실제 업무에 즉각 효율적으로 적용할 수 있도록 만드는 최적의 도구가 될 것”이라고 말했다.
고은이 기자 koko@hankyung.com
Copyright © 한국경제. 무단전재 및 재배포 금지.
- "갑자기 '1조' 비트코인을…" 머스크 깜짝 행보에 '술렁'
- "유럽에선 벌써 인기"…'내년 한국 출시' 도장 찍은 전기차
- "살 빠진다면 月100만원쯤이야"…'기적의 비만약' 문의 폭주
- "한 달 199만원만 내세요"…60대 사이 입소문 난 실버타운 [집코노미-집 100세 시대]
- "변비에 좋은 줄 알았는데"…과음 후 먹었더니 '반전' 효과 [건강!톡]
- "24시 편의점인 줄 알고 들어갔다가…" 30대 직장인 '화들짝' [현장+]
- "태민·이승기 등 연락처 넘기고 불법 사채"…연예계 '발칵'
- 성기가 3개였던 英 남성…사망 후 의대생들이 발견했다
- '76세 득남' 김용건도 제쳤다…83세에 '늦둥이 넷째' 본 배우
- 5만원권 넉장에 320만원?…"내가 사겠다" 난리 난 이유 [강진규의 BOK워치]