플리토, 크라우드소싱으로 구어체 데이터 수집
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
언어 데이터 기업 플리토가 29일 아케이드 서비스의 신규 유형 '대화하기'를 오픈해 구어체 데이터를 구축한다.
플리토 관계자는 "아케이드에서 유저는 퀴즈를 풀며 리워드를 획득할 수 있고, 기업 입장에선 조건에 따른 맞춤형 데이터를 확보할 수 있다"며 "추후 일본어, 중국어를 포함해 동남아, 유럽 언어 등 다국어 서비스를 확장해 구어체 데이터 수집에 집중할 계획"이라고 밝혔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

언어 데이터 기업 플리토가 29일 아케이드 서비스의 신규 유형 '대화하기'를 오픈해 구어체 데이터를 구축한다.
리워드 지급형 퀴즈로 알려진 플리토 아케이드는 크라우드소싱 기반의 글로벌 언어 데이터 구축 서비스다.
이번 '대화하기' 퀴즈 유형에서 사용자는 주어진 상황에 맞춰 자유롭게 대화를 완성하면 커피나 치킨 등 모바일 상품권으로 교환하거나 현금화 가능한 리워드를 받는다. 모국어 능력 하나만으로도 소소한 용돈 벌이가 가능하다.
플리토는 웹과 앱 플랫폼에서 아케이드를 통해 사용자에게 리워드를 지급하고 언어데이터를 수집한다. 플리토가 수집 및 가공한 데이터는 가장 활성화된 AI 분야 중 하나인 '자연어 처리' 기술 향상을 위해 활용되며 그 중 '대화하기' 퀴즈로 수집한 구어체 데이터는 챗봇, AI 비서, 번역기 등의 개발에 필수적이다. 특히 금융, 게임, 물류 등 원하는 주제의 데이터를 빠르게 수집할 수 있다는 것이 강점이다.
구어체는 맞춤법에 맞지 않지만 의미가 통하는 문장, 축약어, 신조어 등 예외 사항이 많아 더 많은 데이터가 필요하지만 개인정보 등의 이유로 수집이 어렵다.
플리토는 이러한 어려움을 플랫폼을 활용해 극복한다는 설명이다. 대량의 데이터를 신속히 수집하는 동시에 유저의 동의를 얻어 저작권까지 확보하고 있다. 또 문맥에 맞지 않거나 갈등을 조장하는 답변, 비속어 등을 작성하면, 다수의 유저가 상호 검수해 부적합 문장으로 걸러낸다.
플리토 관계자는 "아케이드에서 유저는 퀴즈를 풀며 리워드를 획득할 수 있고, 기업 입장에선 조건에 따른 맞춤형 데이터를 확보할 수 있다"며 "추후 일본어, 중국어를 포함해 동남아, 유럽 언어 등 다국어 서비스를 확장해 구어체 데이터 수집에 집중할 계획"이라고 밝혔다.
<저작권자 ⓒ '돈이 보이는 리얼타임 뉴스' 머니투데이, 무단전재 및 재배포 금지>
Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.
- "집안이 반대하는 결혼"…최화정, 21세 연하 이민웅과 커플샷 - 머니투데이
- 후배 폭행하고 신고 못하게 성기 촬영한 고교생... 퇴학 '적법' - 머니투데이
- "이건 사기다"…백종원, 닭갈빗집 사장 '방송용 눈물'에 '분노' - 머니투데이
- [영상] 높이 100m 모래폭풍, 한순간에 中도시 삼켰다 - 머니투데이
- 정주리 "남편 질린 적 없어…싸울 때마다 애 생겼다" 깜짝 고백 - 머니투데이
- 윤종신, '건강 이상'으로 공연 취소…아내 전미라도 '사과' - 머니투데이
- 부부간에도? "야한 사진 주고받지 마" 어기면 '처벌'...중국 '초강수' - 머니투데이
- 내연녀 살해 후 불태운 미국 교수…법원 '기소 취소' 결정, 왜? - 머니투데이
- 인도·대만서 2023년 한국산 잠수함 핵심기술 탈취 시도 정황 - 머니투데이
- HBM4 시대에 HBM3E '몸값' 더 오른다…삼성·SK 기대↑ - 머니투데이