할아버지부터 손자까지.."데이터 라벨러 하루 평균 300명 이상 증가"

장영은 2021. 1. 10. 10:46
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

지난해 인공지능(AI) 학습용 데이터를 만드는 '데이터 라벨러'가 크게 주목을 받으면서 관련 플랫폼 회원 수도 크게 증가한 것으로 나타났다.

10일 AI 학습 데이터 플랫폼 크라우드웍스에 따르면 지난해 가입한 신규 회원수는 총 11만명으로 하루 평균 300명 이상 증가했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AI 학습데이터 플랫폼 크라우드웍스, 서비스 지표 공개
지난해 신규가입자 11만명..총 회원수는 업계 80%
14세부터 93세까지..아르헨티나 거주 회원도

[이데일리 장영은 기자] 지난해 인공지능(AI) 학습용 데이터를 만드는 ‘데이터 라벨러’가 크게 주목을 받으면서 관련 플랫폼 회원 수도 크게 증가한 것으로 나타났다.

10일 AI 학습 데이터 플랫폼 크라우드웍스에 따르면 지난해 가입한 신규 회원수는 총 11만명으로 하루 평균 300명 이상 증가했다.

지난해 1월 10만명을 기록한 누적 회원수도 1년 사이 두배 이상 증가하며 20만명을 돌파했다. 이는 업계 추산 국내 데이터 라벨러의 80%를 차지하는 수준으로 국내 최대 규모이다.

크라우드웍스는 업계 최초로 일반인들을 대상으로 데이터 라벨러를 모집하는 ‘크라우드소싱’ 방식을 선보였다. 이에따라 시간과 제약이 없는 양질의 일자리를 창출하는 한편, AI 솔루션 고도화에 필요한 데이터를 국내외 시장에 제공할 수 있었다는 것이 회사측 설명이다.

데이터 라벨링은 AI가 학습할 수 있는 데이터를 만드는 작업이다. 사진을 보고 ‘개’인지 ‘고양이’인지, 웃는 표정인지 화가 난 표정인지를 구분해 표시하는 작업이다. 단순·반복 작업이 많아 4차 산업혁명 시대의 ‘인형 눈알 붙이기’에 비유되기도 했지만, 시간과 장소의 제약이 없고 전문적인 역량이 필요하지 않아 많은 관심을 받고 있다.

실제로 크라우드웍스에는 최연소 14세부터 최고령 93세까지 다양한 연령층의 회원이 데이터 라벨링에 참여하고 있다. 연령 뿐 아니라 거주지도 다양하다. 20만명의 데이터 라벨러는 국내 뿐 아니라 아시아와 유럽 등 전 세계에 분포돼 있는데, 가장 거리가 먼 국가에 사는 회원은 아르헨티나에 거주하고 있는 것으로 나타났다.

크라우드웍스에서 수집·가공한 데이터 수는 한국어 기초사전 371권 분량에 해당하는 1856만 건이다. 회원들이 데이터를 가공하며 발생한 일 평균 클릭 수는 약 5만3000 번에 달할 것으로 예측된다.

크라우드웍스는 불특정 다수가 참여하기 때문에 발생할 수 있는 데이터 퀄리티 문제를 100% 전수 검수로 해결하고 있으며, 이를 통해 데이터 품질을 고도화한다. 데이터 재가공을 요구하는 반려율은 평균 38%로 집계됐다.지난 한 해 동안 무려 8000번의 반려를 받은 회원도 있는 것으로 조사됐다.

박민우 크라우드웍스 대표는 “2020년은 크라우드웍스가 폭발적으로 성장하며 국내 대표 데이터 라벨링 플랫폼으로써의 입지를 다진 한 해였다”며, “올해는 국내 뿐 아니라 글로벌 AI 시장으로 진출할 발판 마련을 위해 서비스 고도화에 힘쓸 것”이라고 말했다.

장영은 (bluerain@edaily.co.kr)

Copyright © 이데일리. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?