업스테이지, 차세대 OCR 모델 ‘Document Parse’ 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
업스테이지가 17일, 정확하고 빠른 문서 분석이 가능한 차세대 OCR 모델 'Document Parse'를 공개했다.
이 모델은 대규모 언어 모델(LLM)로의 처리가 최적화된 AI 문서 처리 기술로, 현존하는 기술 중 가장 우수한 성능을 자랑한다.
업스테이지는 이 모델이 RAG 시스템의 성능과 LLM의 응답 정확도를 높이는 핵심 요소인 데이터 전처리 과정에서 뛰어난 정확성과 속도, 사용성을 제공한다고 강조했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
[이데일리 김현아 기자] 업스테이지가 17일, 정확하고 빠른 문서 분석이 가능한 차세대 OCR 모델 ‘Document Parse’를 공개했다. 이 모델은 대규모 언어 모델(LLM)로의 처리가 최적화된 AI 문서 처리 기술로, 현존하는 기술 중 가장 우수한 성능을 자랑한다.
이 기술은 HTML과 같은 구조화된 텍스트 형식으로 변환하여 기업이나 기관에서 바로 활용할 수 있다. 업스테이지는 이 모델이 RAG 시스템의 성능과 LLM의 응답 정확도를 높이는 핵심 요소인 데이터 전처리 과정에서 뛰어난 정확성과 속도, 사용성을 제공한다고 강조했다.
업스테이지는 문서 구조 분석의 성능을 객관적으로 측정할 수 있는 벤치마크 ‘DP-Bench’를 함께 공개했다. 분석 결과에 따르면, Document Parse는 AWS와 MS 등 5개 빅테크의 서비스와 비교해 모든 정확성 지표에서 5% 이상 우수한 성능을 보였다. 속도 측면에서도 Document Parse는 1분에 100장을 처리하며, AWS Texttract보다 10배, LamaParse보다 5배 더 빠른 성능을 기록했다.
이 모델은 DOCX, PDF, PPTX, PNG 등 9종의 문서 형식을 지원하며, 수식 인식 및 이미지 추출과 같은 새로운 기능도 추가되었다. HTML 외에도 헤더와 테이블 요소를 마크다운 형식으로 제공하여 LLM 사용자들이 입력 문서의 토큰 크기를 줄일 수 있는 점도 큰 장점으로 꼽힌다.
김성훈 대표는 “Document Parse는 기업이 기존 문서를 가장 정확하게 자산화하여 LLM을 효율적으로 적용할 수 있는 최적의 도구”라며, “다양한 비즈니스에서 활용되어 업무 혁신을 현실화할 것”이라고 밝혔다.
김현아 (chaos@edaily.co.kr)
Copyright © 이데일리. 무단전재 및 재배포 금지.
- 영화 '공공의적' 모티브된 최악의 존속살해[그해 오늘]
- ‘4분의 기적’ 버스서 심정지로 고꾸라진 男, 대학생들이 살렸다
- "술만 마시면 돌변..폭력 남편 피해 아이들과 도망친 게 범죄인가요"
- "임영웅과 얘기하는 꿈꿔...20억 복권 당첨으로 고민 해결"
- '공룡 美남' 돌아온 김우빈, 황금비율 시계는[누구템]
- 경찰, 오늘 '마약 투약 혐의' 유아인에 구속영장 신청
- 2차전지 미련 못 버리는 개미군단 '포퓨'로 진격…포스코그룹株 주가는 글쎄
- '최고 158km' 안우진, 6이닝 2실점 역투...키움, 3연패 탈출
- "보증금, 집주인 아닌 제3기관에 묶는다고"…뿔난 임대인들
- 상간소송 당하자 "성관계 영상 유포하겠다" 협박한 20대 여성[사랑과전쟁]