KISTI, 기계학습 데이터 활용서비스 '스타트'
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
한국과학기술정보연구원(KISTI)이 '과학기술 분야 기계학습 데이터 구축 사업'의 결과물을 누구나 쉽게 활용할 수 있도록 과학기술 지식 인프라 사이언스온(ScienceON)에서 '기계학습 데이터 활용 서비스'를 시작했다고 3일 밝혔다.
김재수 KISTI 원장은 "현재 많은 연구 분야에서 AI를 활용하고 있으나 AI가 활용할 수 있는 데이터, 즉 기계학습 데이터는 부족한 실정"이라며 "사이언스온에 다양한 기계학습 데이터를 서비스함으로써 연구계에 큰 도움이 될 것"이라며 "혁신적 연구 활동 지원과 새로운 비즈니스 창출에 기여할 것"이라고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
한국과학기술정보연구원(KISTI)이 ‘과학기술 분야 기계학습 데이터 구축 사업’의 결과물을 누구나 쉽게 활용할 수 있도록 과학기술 지식 인프라 사이언스온(ScienceON)에서 ‘기계학습 데이터 활용 서비스’를 시작했다고 3일 밝혔다.
이를 위해 KISTI는 과학기술 분야 국내 논문과 국가 연구개발(R&D) 연구 보고서를 토대로 인공지능(AI)을 위한 데이터셋 5종 425만 건을 구축했다. 이를 통해 기계학습 데이터 4종(논문 전문 텍스트, 보고서 표·그림, 논문 QA, 논문 문장 의미태깅)을 접목한 서비스를 선보였다.
구체적으로 검색 키워드가 본문 문장에서 어떻게 표현되는지 키워드의 전후 내용을 스니펫(검색한 의도에 부합하는 답을 제공할 수 있는 최소한의 단위)으로 제공한다. 보고서에 수록된 표·그림 이미지, 캡션, 인용 문장까지도 함께 제공한다. 논문 QA 데이터를 활용해 논문의 핵심 어휘를 질문과 답변 형식으로 쉽게 풀이해 제공한다. 연구 목적, 방법, 결과를 요약해 제공한다. 이 밖에 요약 정보를 PDF 원문에 표시해 제공한다. 특정 참고문헌이 인용된 문장도 논문에서 바로 확인할 수 있다.
김재수 KISTI 원장은 “현재 많은 연구 분야에서 AI를 활용하고 있으나 AI가 활용할 수 있는 데이터, 즉 기계학습 데이터는 부족한 실정”이라며 “사이언스온에 다양한 기계학습 데이터를 서비스함으로써 연구계에 큰 도움이 될 것”이라며 “혁신적 연구 활동 지원과 새로운 비즈니스 창출에 기여할 것”이라고 말했다.
고광본 선임기자 kbgo@sedaily.comCopyright © 서울경제. 무단전재 및 재배포 금지.
- 월 수익 3만원인데 제네시스 탄다…역대급 카푸어 女 직업은
- 거인병 투병 김영희 '서장훈·허재가 돈 보내줘…연금 70만원으로 생활'
- '축의금 3만원 낸 친구의 감동 택배'… 사연 주인공 보니
- 찜기 밑 벌레 '다닥다닥'…이 공장서 순대 연간 400억 팔려
- 핼러윈 '女 엉덩이 몰카'…고릴라맨 말고 또 있었다
- 김어준 두둔한 TBS 대표에…유창선 '시민을 바보로 여기나'
- ‘김선호 논란’에 유승민 “무고죄 엄하게 처벌해야”
- 현우진, 부동산도 1타강사?…8년전 7억에 청담자이 산 친구 지금은
- 文 '우리 청년들, 공정 진지하게 생각...성평등 위해 연대하길'
- 조커 옷 입고 칼부림·방화…아수라장 된 도쿄 전철