KISTI, 기계학습 데이터 활용서비스 '스타트'

고광본 선임기자 2021. 11. 3. 17:55
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

한국과학기술정보연구원(KISTI)이 '과학기술 분야 기계학습 데이터 구축 사업'의 결과물을 누구나 쉽게 활용할 수 있도록 과학기술 지식 인프라 사이언스온(ScienceON)에서 '기계학습 데이터 활용 서비스'를 시작했다고 3일 밝혔다.

김재수 KISTI 원장은 "현재 많은 연구 분야에서 AI를 활용하고 있으나 AI가 활용할 수 있는 데이터, 즉 기계학습 데이터는 부족한 실정"이라며 "사이언스온에 다양한 기계학습 데이터를 서비스함으로써 연구계에 큰 도움이 될 것"이라며 "혁신적 연구 활동 지원과 새로운 비즈니스 창출에 기여할 것"이라고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

사이언스온서 425만건 개방
김재수 KISTI 원장.
[서울경제]

한국과학기술정보연구원(KISTI)이 ‘과학기술 분야 기계학습 데이터 구축 사업’의 결과물을 누구나 쉽게 활용할 수 있도록 과학기술 지식 인프라 사이언스온(ScienceON)에서 ‘기계학습 데이터 활용 서비스’를 시작했다고 3일 밝혔다.

이를 위해 KISTI는 과학기술 분야 국내 논문과 국가 연구개발(R&D) 연구 보고서를 토대로 인공지능(AI)을 위한 데이터셋 5종 425만 건을 구축했다. 이를 통해 기계학습 데이터 4종(논문 전문 텍스트, 보고서 표·그림, 논문 QA, 논문 문장 의미태깅)을 접목한 서비스를 선보였다.

구체적으로 검색 키워드가 본문 문장에서 어떻게 표현되는지 키워드의 전후 내용을 스니펫(검색한 의도에 부합하는 답을 제공할 수 있는 최소한의 단위)으로 제공한다. 보고서에 수록된 표·그림 이미지, 캡션, 인용 문장까지도 함께 제공한다. 논문 QA 데이터를 활용해 논문의 핵심 어휘를 질문과 답변 형식으로 쉽게 풀이해 제공한다. 연구 목적, 방법, 결과를 요약해 제공한다. 이 밖에 요약 정보를 PDF 원문에 표시해 제공한다. 특정 참고문헌이 인용된 문장도 논문에서 바로 확인할 수 있다.

김재수 KISTI 원장은 “현재 많은 연구 분야에서 AI를 활용하고 있으나 AI가 활용할 수 있는 데이터, 즉 기계학습 데이터는 부족한 실정”이라며 “사이언스온에 다양한 기계학습 데이터를 서비스함으로써 연구계에 큰 도움이 될 것”이라며 “혁신적 연구 활동 지원과 새로운 비즈니스 창출에 기여할 것”이라고 말했다.

고광본 선임기자 kbgo@sedaily.com

Copyright © 서울경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?