정부 역대 최대 규모 AI 학습용 데이터 개방…약 26억건
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
정부가 역대 최대 규모의 인공지능(AI) 학습용 데이터를 개방한다.
과학기술정보통신부는 한국지능정보사회진흥원(NIA)과 지난해 구축한 학습용 데이터셋 310종을 오는 7월말까지 순차 개방한다고 30일 밝혔다.
지금까지 개방된 데이터는 한국어, 이미지‧영상, 헬스케어 등 6대 분야에서 381종, 약 11억건에 이른다.
이번에는 310종 약 15억건의 데이터를 개방하게 된다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
(서울=뉴스1) 윤지원 기자 = 정부가 역대 최대 규모의 인공지능(AI) 학습용 데이터를 개방한다.
과학기술정보통신부는 한국지능정보사회진흥원(NIA)과 지난해 구축한 학습용 데이터셋 310종을 오는 7월말까지 순차 개방한다고 30일 밝혔다.
과기정통부와 NIA는 지난 2020년부터 매년 약 200종의 데이터를 구축해왔다. 지금까지 개방된 데이터는 한국어, 이미지‧영상, 헬스케어 등 6대 분야에서 381종, 약 11억건에 이른다.
데이터는 'AI 허브'에 개방된다. AI 허브에 공개된 데이터는 국제 표준에 맞는 품질 기준을 달성하고 개인정보 비식별화를 거쳤다. 지난해 7월에는 AI 허브 연간 방문자 수가 최초로 100만명을 돌파했다.
이번에는 310종 약 15억건의 데이터를 개방하게 된다. 지난해 구축 분야가 제조‧로보틱스‧교육‧금융‧스포츠 등 14개로 확장되면서다. AI 허브 이용자들은 총 691종, 약 26억건의 데이터를 활용할 수 있게 된다.
과기정통부는 매달 약 80여종을 개방해 7월말까지 310종 전체를 개방할 수 있도록 한다는 방침이다.
엄열 과기정통부 인공지능정책관은 "우리 기업들과 연구자들이 새로운 데이터 확보에 어려움을 겪지 않도록 기존의 라벨링 데이터 중심의 사업을 개편하여 초거대 인공지능 학습에 필요한 대규모 비라벨링 데이터와 한번에 여러가지 유형을 학습시킬 수 있는 다중임무형 라벨링 데이터 등 다양한 유형의 데이터를 지속 확보해 나갈 예정"이라고 말했다.
g1@news1.kr
Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.
- "성관계 안한지 몇년"…전현무, 결혼 관련 숏폼 알고리즘 들통
- 홍준표 "이재명에 징역 1년 때린 대단한 법관, 사법부 독립 지켜" 극찬
- 생후 30일 미모가 이정도…박수홍, 딸 전복이 안고 '행복'
- 서점서 쫓겨난 노숙자 부른 직원 "다 못 읽으셨죠? 선물"…20년 후 반전
- "제일 큰 존재"…'사혼' 박영규, 54세 나이차 막둥이 딸 최초 공개
- '이나은 옹호 사과' 곽튜브, 핼쑥해진 외모 자폭 "다른 이유 때문"
- 실종됐다는 5세 아동, 알고 보니 진돗개 숭배 사이비 단체 범행
- 배다해, ♥이장원과 결혼 3주년 자축 "지금처럼만 지내자 여보" [N샷]
- "로또 1등 당첨돼 15억 아파트 샀는데…아내·처형이 다 날렸다"
- "자수합니다"던 김나정, 실제 필로폰 양성 반응→불구속 입건(종합)