크라우드웍스, 데이터셋 공식 판매 채널 오픈 "AI 생태계 만든다"

김건우 기자 2024. 11. 18. 10:12
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

크라우드웍스는 고품질 데이터셋 유통·판매 비즈니스를 본격화한다고 18일 밝혔다.

크라우드웍스가 공식 채널을 통해 유통에 나서는 데이터셋은 라이선스를 확보한 산업 특화 데이터셋이다.

김우승 크라우드웍스 대표이사는 "AI 프로젝트가 성공하려면 데이터의 양적 확대보다 품질에 집중해야 한다 "며 "양질의 데이터가 부족한 상황에서 신뢰할 수 있는 데이터셋 공급을 통해 기업의 AI 프로젝트 성공을 돕고 건강한 AI 생태계를 만들어갈 것"이라고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.


크라우드웍스는 고품질 데이터셋 유통·판매 비즈니스를 본격화한다고 18일 밝혔다.

크라우드웍스가 공식 채널을 통해 유통에 나서는 데이터셋은 라이선스를 확보한 산업 특화 데이터셋이다.△웍스원(WorksOne) △광고 분석 △건강검진 결과 △전문 지식 Q&A △기업 정보 △도서 △뉴스 기사 데이터셋 등으로 구성돼 있다. 저작권 침해, 개인정보보호 등 법적 리스크가 없어 기업이 활용하기에 용이하고, AI(인공지능)가 아닌 검증된 전문가가 구축해 전문성과 신뢰성이 높은 것이 특징이다.

'웍스원 데이터셋'은 기업에서 자주 사용하는 답변 형식 혹은 기업이 선호하는 표현으로 AI(인공지능)가 답할 수 있도록 설계됐다. '광고 분석 데이터셋'은 국내 광고 1만여 건의 광고 데이터를 분석해 제작됐으며, 광고 정보, 타깃, 목표, 카피 표현방식 등 직접 구축한 메타 데이터가 담겨있다.

이 밖에도 240개 국가 3억 개 이상의 최신 기업 정보를 포함하는 '기업 정보 데이터셋', 장르와 카테고리별 '도서(e-book) 데이터셋', 1만 5천여 건의 '건강검진 결과 데이터셋', 5억 건 이상의 '뉴스 기사 데이터셋', 16개 분야별 전문가가 생성한 '전문지식 Q&A 데이터셋' 등 다양한 데이터셋을 제공한다.

크라우드웍스는 AI 기술 기반의 정확하고 까다로운 검수 작업을 거쳐 고품질 데이터를 제공하고 있다. 현재까지 누적 2억 6000만 개 이상의 AI 데이터를 구축한 풍부한 경험을 토대로, 탁월한 데이터 품질 관리 역량을 인정받아 국가 AI 데이터 표준화에도 기여했다. 앞으로 데이터 유통 시장이 활발해질 수 있도록 모빌리티, 테크, 법률, 교육, 미디어 등 다양한 특화 데이터 라인업을 확대해 나갈 계획이다.

김우승 크라우드웍스 대표이사는 "AI 프로젝트가 성공하려면 데이터의 양적 확대보다 품질에 집중해야 한다 "며 "양질의 데이터가 부족한 상황에서 신뢰할 수 있는 데이터셋 공급을 통해 기업의 AI 프로젝트 성공을 돕고 건강한 AI 생태계를 만들어갈 것"이라고 말했다.

김건우 기자 jai@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?