AI가 문서파일 검색해 정답 알려준다

김만기 2021. 9. 7. 13:31
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

국내 연구진이 개발한 인공지능(AI)에게 '출장 경비가 100만원 들 때, 결재를 어느 선까지 받아야 할까'라고 물었다.

AI는 행정문서 파일을 검색한 뒤 '100만 원 이하인 경우, 실장 전결'이라고 답했다.

한국전자통신연구원(ETRI)은 언어지능연구실 임준호 박사팀이 사용자가 질문하면 문서파일을 검색해 정답을 알려주는 '행정문서QA' 어플리케이션 프로그램 인터페이스(API)를 개발했다고 7일 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

ETRI, AI·딥러닝 기술 적용한 API 개발
질문하면 파일 검색해 답하고 문서 찾아줘
[파이낸셜뉴스] 국내 연구진이 개발한 인공지능(AI)에게 '출장 경비가 100만원 들 때, 결재를 어느 선까지 받아야 할까'라고 물었다. AI는 행정문서 파일을 검색한 뒤 '100만 원 이하인 경우, 실장 전결'이라고 답했다. 또한 사내 규정이 담긴 문서파일과 그 근거부분까지 찾아 보여줬다.

한국전자통신연구원(ETRI)은 언어지능연구실 임준호 박사팀이 사용자가 질문하면 문서파일을 검색해 정답을 알려주는 '행정문서QA' 어플리케이션 프로그램 인터페이스(API)를 개발했다고 7일 밝혔다. 또한 두 문장이 같은 의미인지 이해하는 '패러프레이즈' API도 개발했다. 연구진은 필요한 내용을 빠르게 파악해 업무 생산성을 높이고 정보 공유와 활용도를 높이는 데 도움이 될 것이라고 전망했다.

이 기술은 ETRI 공공 인공지능 오픈 API·데이터 서비스 포털에 공개돼 누구나 쉽게 이용할 수 있다. 임준호 박사는 "이 기술로 한국어 AI 서비스 시장이 더욱 활성화돼 외국산 AI 솔루션의 국내시장 잠식을 막고 국민들이 유용한 지식 정보를 쉽고 빠르게 습득할 수 있는데 도움이 되기를 기대한다"고 말했다.

연구진은 공동연구기관인 한글과컴퓨터에서 블라인드 평가로 정확도를 측정했다. 그 결과, 단락을 대상으로 검색해 나온 상위 5개 결과의 정확도는 89.65%, 표를 대상으로 진행한 검색에서는 81.5%로 높은 정확도를 보였다.

또, 패러프레이즈 인식 API는 사람처럼 똑똑하게 문서를 보고 다른 형태의 문장이 같은 뜻을 지니는지 파악하는 기술이다. 앞서 나온 행정문서QA API와 다른 한국어 AI 개발에도 쓰일 수 있는 원천 기술이다.

AI와 딥러닝 기술은 사람과 달리 문장이 조금만 달라져도 의미 관계를 바르게 인식하지 못하는 견고성 문제가 있었다. 예를 들어 '그는 빨간 자전거를 샀다'와 '그가 산 자전거는 빨간색이다'라는 문장은 사람과 기계가 쉽게 구분한다. 하지만 '그는 빨간 자전거를 안 샀다'라는 문장과는 구분을 잘하지 못한다.

연구진은 딥러닝 기술의 견고성 한계를 개선해 다양한 유형의 문장에서 의미 관계를 인식하도록 API를 개발했다. 견고성 평가셋 대상 평가 결과, 96.63% 정확도를 보이며 기존 오픈소스 딥러닝 기술보다 성능을 크게 개선했다.

개발된 API는 표준인 XML 기반으로 문서 서식을 처리한다. 연구진은 현재 한글 문서 대상으로만 서비스가 가능하지만 개발 기술 자체는 워드, PDF 등 다른 문서에도 범용적으로 쓰일 수 있다고 설명했다.
#인공지능 #AI #ETRI #한국전자통신연구원 #한글과컴퓨터 #정확도 #API #문서파일 #언어지능 #패러프레이즈

Copyright © 파이낸셜뉴스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?