레딧, 데이터 유료화 추진…"AI 학습시키려면 돈 내야"

박종화 2023. 4. 19. 14:54
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

미국 온라인 커뮤니티 '레딧'이 인공지능(AI) 학습에 이용되는 레딧 게시물을 유료화하겠다는 구상을 내놨다.

스티브 허프먼 레딧 최고경영자(CEO)는 18일(현지시간) 뉴욕타임스(NYT) 인터뷰에서 그동안 구글, 오픈AI, 마이크로소프트 등의 생성형AI 학습에 플랫폼 내 다양한 콘텐츠가 무료로 제공됐던 것과 관련해 "레딧의 데이터는 정말로 가치가 있다. 그러한 가치 있는 것들을, 그것도 세계에서 가장 큰 회사들에 전부 무료로 제공할 필요는 없다"고 강조했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AI 붐에 '학습 데이터' 가치도 동반 상승
"세계적 대기업에 무료 제공할 필요 없어"
트위터, 월 최대 2.7억원 받고 데이터 판매

[이데일리 박종화 기자] 미국 온라인 커뮤니티 ‘레딧’이 인공지능(AI) 학습에 이용되는 레딧 게시물을 유료화하겠다는 구상을 내놨다. AI 산업이 커지면서 AI 학습에 필요한 데이터 가치도 덩달아 높아지고 있다.

(사진=AFP)

스티브 허프먼 레딧 최고경영자(CEO)는 18일(현지시간) 뉴욕타임스(NYT) 인터뷰에서 그동안 구글, 오픈AI, 마이크로소프트 등의 생성형AI 학습에 플랫폼 내 다양한 콘텐츠가 무료로 제공됐던 것과 관련해 “레딧의 데이터는 정말로 가치가 있다. 그러한 가치 있는 것들을, 그것도 세계에서 가장 큰 회사들에 전부 무료로 제공할 필요는 없다”고 강조했다. 이어 “레딧을 크롤링(자동으로 온라인 정보를 수집하는 것)해 (부가)가치를 만들면서 레딧 이용자에게 아무 것도 돌려주지 않는 건 문제가 있다”고 지적했다.

앞으로 래딧 내부에서 생성되는 데이터도 거래 대상으로 삼겠다는 얘기다. 2005년 설립된 레딧은 하루 평균 5700만명이 찾는 미국의 대표적인 온라인 커뮤니티다. 오픈AI와 구글은 각각 자사의 생성형AI 서비스인 챗GPT와 바드를 학습시키는 데 레딧 게시물을 활용했다. 방대한 데이터를 학습할수록 생성형AI 정확도가 높아지기 때문이다. 하지만 앞으로는 다른 기업이 레딧 커뮤니티 내 대화를 다운로드 ·처리할 수 있는 API(응용 프로그램 인터페이스·프로그램을 외부 서비스와 연결하기 위한 도구)를 이용할 때 비용을 청구할 것이라고 레딧은 설명했다.

최근 AI 산업이 커지면서 AI를 고도화하기 위한 데이터의 중요성도 커지고 있다. 트위터는 이미 지난 2월 트윗에 접근할 수 있는 API를 유료화했다. 트위터 API를 한 달간 이용하는 데 드는 요금은 최소 100달러(약 13만원), 최대 21만달러(약 2억 7700만원)다. 이미지 판매 회사인 셔터스톡은 아예 오픈AI와 제휴를 맺고 창작자 등과 수익을 나누기로 했다. 오픈AI는 셔터스톡 이미지를 이용해 이미지 생성형AI인 ‘달리’(DALL-E)를 훈련시키고 있다.

박종화 (bell@edaily.co.kr)

Copyright © 이데일리. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?