'OCR의 진화'…비정형문서 구조·맥락 파악하는 AI 솔루션 출시
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
이 솔루션은 기존 OCR의 문자 인식 기능을 넘어 문서의 의미와 구조를 자동 분석하고 핵심 정보를 추출할 수 있도록 설계됐다.
기존 OCR 솔루션은 문서 이미지에서 텍스트를 추출하는 데 그쳐 표, 조항, 문단 등 복잡한 문서 구조를 인식하는 데 한계가 있었다.
DEEP OCR+의 경우 특정 포맷에 의존하지 않고도 문서의 전체 구조와 의미를 이해할 수 있다.
이미지와 텍스트를 동시에 처리할 수 있는 VLM 기술을 바탕으로 비정형화된 문서도 즉시 처리 가능하다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

시각지능 AI(인공지능) 솔루션을 개발하는 한국딥러닝이 비전언어모델(VLM) 기반 광학문자인식(OCR) 솔루션 'DEEP OCR+'를 출시했다고 11일 밝혔다.
이 솔루션은 기존 OCR의 문자 인식 기능을 넘어 문서의 의미와 구조를 자동 분석하고 핵심 정보를 추출할 수 있도록 설계됐다. 지난 5년간 4억장 이상의 텍스트·이미지 문서를 학습한 자체 VLM 모델을 기반으로 개발됐다.
한국딥러닝 관계자는 "기업들은 별도의 데이터 수집이나 라벨링 없이도 다양한 문서 유형을 즉시 처리할 수 있다. 최소한의 고객 데이터만으로도 최적의 정확도를 보장한다"고 했다.
기존 OCR 솔루션은 문서 이미지에서 텍스트를 추출하는 데 그쳐 표, 조항, 문단 등 복잡한 문서 구조를 인식하는 데 한계가 있었다. 계약서나 청구서처럼 포맷이 일정하지 않은(비정형) 문서의 경우 문서마다 별도 설계와 라벨링이 필요해 OCR 도입·유지 비용이 높았다.
DEEP OCR+의 경우 특정 포맷에 의존하지 않고도 문서의 전체 구조와 의미를 이해할 수 있다. 이미지와 텍스트를 동시에 처리할 수 있는 VLM 기술을 바탕으로 비정형화된 문서도 즉시 처리 가능하다. 특히 주요 정보를 구조화된 형태로 정리해 준다.
예를 들어 계약서를 인식하면 날짜, 금액, 주요 조항 등을 추출하고 리스크가 될 수 있는 항목을 요약해 표시하는 식이다. 이를 통해 문서 검토·입력에 소요되는 시간을 대폭 줄일 수 있으며, 이를 기반으로 ERP(전사적 자원관리) 등과 연동해 업무 자동화가 가능하다는 설명이다.
김지현 한국딥러닝 대표는 "최근 단순한 인식 기술을 넘어 문서 내 의미와 맥락까지 파악할 수 있는 AI 기술에 대한 관심이 함께 높아지고 있다. 이번 신제품은 이러한 흐름 속에서 문서 처리 기술의 진화를 보여주는 사례가 될 것"이라고 강조했다.
[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']
최태범 기자 bum_t@mt.co.kr
Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.
- 박보검, '장풍쏘는 목사' 그 교회 탈출?…"션과 같이 예배" 목격담 - 머니투데이
- 17살 제자와 성관계…"날 방치한 남편 탓" 황당 주장한 美 40대 교사 - 머니투데이
- 경호원한테 어떻게 했길래…나나, '인성논란' 아이돌에 공개 일침 - 머니투데이
- 사극 단골 배우였는데…"처가살이하며 식당 주차관리" 무슨 일? - 머니투데이
- "故 김새론, 가수 남친 있었다…커피차 보내기도" 이진호 주장 - 머니투데이
- [단독]헌재, 국민의힘이 낸 "내란전담재판부는 위헌" 헌법소원 각하 - 머니투데이
- 장윤정 "무대 아래서 몸 만져 무섭다"…'나쁜 손' 탓에 목욕탕도 못 가는 사연 - 머니투데이
- "변태적 성관계 요구" 이혼 소송 건 아내…남편 "치 떨려" 분통, 왜? - 머니투데이
- 공군, F-16 전투기 추락…비상 탈출 후 20m 나무 걸린 조종사 극적 구출 - 머니투데이
- '자사주 소각' 기업 벌써 2배 늘었다..."주가 들썩" 상법개정 수혜주는 - 머니투데이