사람대신 AI로 데이터 수집부터 분석까지…"AI 서비스 개선 도와"

김미정 기자 2024. 2. 9. 13:14
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

크라우드웍스·슈퍼브에이아이·콕스웨이브, 데이터 작업 자동화 솔루션 제공

(지디넷코리아=김미정 기자)국내 스타트업이 인공지능(AI) 기술을 활용해 AI 서비스 기능을 개선하고 있다. AI 서비스 핵심 요소인 데이터 수집부터 가공·라벨링에 드는 시간을 줄이는 솔루션이 줄줄이 나오는 추세다. 사람대신 AI가 데이터 작업을 진행함으로써 AI 서비스 개선을 더 빠르고 효율적으로 할 수 있다. 

크라우드웍스는 AI 모델에 필요한 데이터를 수집·가공하는 기업이다. 데이터 수집은 크라우드 소싱 방식으로 이뤄진다. 

크라우드웍스는 AI 모델에 필요한 데이터를 일반 시민들로부터 수집해 가공한다. (사진=크라우드웍스)

예를 들어, 이미지 데이터를 수집해야 하는 경우 자사 사이트에 프로젝트성으로 이벤트를 연다. 일반 대중은 해당 홈페이지에 접속해 간단한 게임에 참여할 수 있다. 이를 통해 포인트를 얻을 수 있다. 크라우드웍스는 이렇게 모은 데이터를 수집한 후 가공한다. 편향, 반복된 데이터는 거른다. 

데이터 가공을 마치면, AI 모델이나 서비스에 넣는다. 데이터 종류는 이미지, 영상, 텍스트, 음성 등이다. 크라우드웍스 측은 AI 제품이나 모델 품질을 좌우하는 가장 큰 요소는 데이터 질이라는 입장이다. 현재 주요 고객사로 중소·스타트업을 꼽았다. 회사 내부에 거대언어모델(LLM)을 도입하거나, AI 서비스 개발을 원하는 사업장에 맞춤형 데이터를 제공한다.

"영상 데이터 라벨링 사람보다 잘 해"

슈퍼브에이아이는 비전 AI 기술 개발 활성화를 돕고 있다. 인간 개발자가 특정 이미지나 영상에 등장하는 물체에 라벨을 붙인 후 AI에 알려주는 식이다. 이후 AI가 비슷한 사진과 영상을 보면 해당 물체들을 구분할 수 있다. 

자동 라벨링이 진행되는 모습. (사진=슈퍼브에이아이)

예를 들어, 개발자가 영상 속 등장하는 자동차와 자전거에 라벨을 붙인 후 AI에게 알린다. AI는 이를 학습하고 이후 자동차와 자전거를 스스로 구분할 수 있게 된다. AI가 이미지·영상 데이터를 직접 선별하고 라벨링까지 하는 방식이다. 

일반적으로 이미지나 영상 데이터를 선별하려면 긴 시간이 걸린다. 특히 개발자는 일일이 데이터 라벨링 작업을 필수로 거쳐야 한다. 라벨링에 오류가 생기면 이를 바로잡는 데 몇 주가 걸린다. 업계 관계자는 "외주업체에 데이터 라벨링을 의뢰하지만, 라벨링 오류가 여전히 많다"고 털어놨다. 

업무 효율성을 위해 AI를 개발하지만, 오히려 그 과정 속에서 비효율을 경험하고 있다는 의미다. 이에 업계는 이미지나 영상 데이터 라벨링을 기존보다 더 빠르고 쉽게 개발할 수 있는 해결책을 찾고 있다. 

슈퍼브에이아이는 LLM이 아닌 멀티모달 기술의 비전 영역에 초점 맞춘 서비스를 제공한다. 가장 대표 제품은 '슈퍼브 라벨'이다. AI가 데이터 라벨링을 돕는 플랫폼이다. 멀티모달 모델이 학습할 수 있는 형태로 데이터를 가공해 준다. IT 개발 지식은 없어도 된다. 클릭 몇 번만으로 AI를 개발하고 관리할 수 있도록 직관적인 솔루션을 운영하고 있다.

모든 이미지와 사진에 라벨링을 수작업으로 진행하는 것보다 업무 생산성을 높일 수 있는 셈이다.

"데이터 분석 통해 AI 서비스 개선"

콕스웨이브는 사용자 데이터 분석을 통해 AI 서비스 기능을 개선해 준다. 현재 관련 솔루션 '얼라인 AI'를 운영 중이다. 생성형 AI 기술 개발부터 제품 상용화, 매각 등 서비스 제작 전 과정에서 활용된다.

얼라인 AI가 데이터 분석을 진행하는 장면. (사진=콕스웨이브)

얼라인 AI는 서비스 사용자 데이터 기반으로 분석을 진행한다. 사용자와 서비스 간 대화를 포함한 복잡적인 사용자 행동 데이터를 분석한다. 이를 토대로 고객 맞춤형 서비스나 제품에 필요한 사항을 보고서 형식으로 내놓는다.

기존 분석 플랫폼이 페이지 내 버튼 클릭률, 페이지 체류 시간 등 단순 데이터에 집중했다. 반면 얼라인 AI는 사용자와 AI 간 대화를 포함한 복합적인 사용자의 행동 데이터까지 분석 가능하다. 이를 챗GPT 같은 LLM 기반 서비스와 제품에 바로 도입할 수 있다.

콕스웨이브 측은 사용자들이 어떤 의도로 서비스를 사용하고 있는지, AI가 사용자 의도대로 잘 행동하고 있는지 등 보다 깊은 층위의 분석을 할 수 있다고 전했다.

김미정 기자(notyetkim@zdnet.co.kr)

Copyright © 지디넷코리아. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?