[제1회 인공지능 신뢰성·품질 대상]우수상-업스테이지 '다큐멘트 AI'
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
업스테이지 다큐멘트 AI(Document AI)는 활용이 어려운 비정형 텍스트 데이터(PDF 줄글, 이미지 내 글자, 자연어 글 등)를 구조화하고, 핵심 내용을 추출해 디지털화하는 솔루션이다.
기업이 비정형 데이터가 사용되는 작업을 자동화하거나 그동안 활용하지 못한 데이터를 디지털화해 가치 있게 사용할 수 있도록 돕는다.
이를 통해 안정성 확보 측면에서 AI 시스템 내 모델이 제공하는 신뢰도 점수의 활용이 가능하다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
업스테이지 다큐멘트 AI(Document AI)는 활용이 어려운 비정형 텍스트 데이터(PDF 줄글, 이미지 내 글자, 자연어 글 등)를 구조화하고, 핵심 내용을 추출해 디지털화하는 솔루션이다. 기업이 비정형 데이터가 사용되는 작업을 자동화하거나 그동안 활용하지 못한 데이터를 디지털화해 가치 있게 사용할 수 있도록 돕는다. 삼성생명·한화생명 등이 청구·심사에 사용되는 의료내역서, 기록 등 형태가 다른 문서의 디지털화와 문서 처리 자동화에 활용하고 있다.
특히 Document AI 내 인공지능 모델들은 모두 신뢰도 측정(Confidence Calibration) 방법을 통해 사람이 인지하는 정확도와 모델이 제공하는 신뢰도 점수(confidence score) 일치하게 제공하도록 개발된다. 이를 통해 안정성 확보 측면에서 AI 시스템 내 모델이 제공하는 신뢰도 점수의 활용이 가능하다.
Document AI의 AI 시스템은 여러 개 AI 모델의 조합으로 구성된다. 최종 결과(문서 내 정보 추출)에 대해 하나의 신뢰도 점수를 제공하며, 이는 여러 개 모델의 신뢰도 점수를 조합, 제공하는 점수다. 이러한 신뢰도 점수는 인공지능 모델의 결과에 대한 신뢰성을 판단할 수 있는 근거 자료로 활용된다. 나아가 개별 모듈의 신뢰도 점수는 역추적이 용이하며, 어디서 오류가 발생했는지 원인 추적이 가능하다. 이를 통해 AI 모델의 투명성과 설명가능성을 확보할 수 있다.
핵심 기능은 문제 내 핵심 정보를 추출해 문서처리 시스템을 자동화하는 것이다. 또 일회적인 데이터 구축 및 라벨링으로 그치지 않고 여러 단계에 걸쳐 데이터 수정, 보완을 진행한다. 강건성 확보 작업을 반복적으로 수행해, 지속적이고 균일한 데이터 품질 관리에 용이하다.
업스테이지 관계자는 “신뢰도 점수를 참조해 모델 취약점을 발굴하고 이를 보완할 수 있는 데이터를 구성한다”며 “이러한 품질 관리 체계는 고품질의 AI 모델 확보를 가능하게 하고 데이터의 특성을 모니터링하고 개선하여 신뢰성을 확보하는 프로세스”라고 말했다.
조재학 기자 2jh@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.
- LG 구광모, 세대 교체 인사...부품계열 새 판 짰다
- LG디스플레이 신임 CEO 정철동…'애플·공정 전문가 구원투수로'
- 행정망 복구했지만 툭하면 잔고장…“하드웨어 문제” 정부 주장 무색
- LG CNS, 상무 5명 선임 등 2024년 정기임원인사 실시
- 코웨이, '비렉스' 앞세워 힐링케어 시장 정조준
- 韓·英 사이버안보기관, 합동 권고문 발표…“北 , SW 공급망 공격 위협”
- [제1회 인공지능 신뢰성·품질 대상]이영복 제네시스랩 대표 “신뢰·윤리 갖춘 AI 개발”
- [제1회 인공지능 신뢰성·품질 대상] 혁신 AI 기술·서비스 기업 9개사 수상
- [2023 올해의 SNS]숏폼·ESG 콘텐츠 '쑥'…SNS, 데이터 구축·마케팅 '창구' 됐다
- [2023 올해의 SNS]중소벤처기업부, '신뢰' 정보로 국민 눈높이 소통…최고 '우뚝'