세계 최대 커뮤니티 레딧 '살아 있는 데이터', 챗GPT 훈련에 쓰인다

이서희 2024. 5. 17. 14:50
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

생성형 인공지능(AI) 챗GPT 개발사 오픈AI가 세계 최대 온라인 커뮤니티 업체 '레딧'과 파트너십을 맺었다.

오픈AI는 레딧의 콘텐츠를 챗GPT 훈련에 활용하고, 레딧은 오픈AI의 AI 모델을 광고 사업과 이용자를 위한 AI 기능 개발 등에 이용한다는 게 협력의 골자다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

오픈AI, 레딧과 파트너십 계약 체결
AI 훈련 위한 '실시간' 정보 대량 확보
세계 최대 온라인 커뮤니티 '레딧'의 로고. 로이터 연합뉴스

생성형 인공지능(AI) 챗GPT 개발사 오픈AI가 세계 최대 온라인 커뮤니티 업체 '레딧'과 파트너십을 맺었다. 오픈AI는 레딧의 콘텐츠를 챗GPT 훈련에 활용하고, 레딧은 오픈AI의 AI 모델을 광고 사업과 이용자를 위한 AI 기능 개발 등에 이용한다는 게 협력의 골자다.

2005년 설립된 레딧은 일일 순 방문자가 7,000만 명이 넘는 분권형 커뮤니티다. 사이트 안에는 사진·영상·글 등을 공유할 수 있는 10만 개 이상의 주제별 게시판이 있는데, 각 게시판은 이용자들이 직접 만들고 운영한다. 한국으로 치면 디시인사이드와 비슷하다.


올트먼, 레딧 지분 1조 원 이상 보유

양 사는 16일(현지시간) 파트너십 계약 체결 사실을 발표했다. 계약 금액은 밝히지 않았다. 스티브 허프먼 레딧 최고경영자(CEO)는 "레딧은 항상 최신인 사람들 간 대화를 담고 있는 인터넷 최대의 공개 저장소"라며 "챗GPT가 레딧에 들어오면 이용자들이 원하는 것을 더 많이 찾는 한편 새로운 이용자가 유입되는 데 도움이 될 것"이라고 밝혔다. 이 소식에 이날 레딧 주가는 시간 외 거래에서 11% 이상 폭등했다. 레딧은 지난 3월 뉴욕 증시에 상장했다.

오픈AI에서는 브래드 라이트캡 최고운영책임자가 이번 거래를 주도한 것으로 알려졌다. 다만 샘 올트먼 최고경영자와 레딧 간 '특수 관계'가 거래 성사에 결정적인 영향을 줬을 거라는 게 업계의 시각이다. 올트먼은 한때 레딧의 이사를 지냈고, 레딧의 초기 투자자로서 현재도 대주주 중 하나다. 이날 기준 올트먼이 보유한 레딧의 지분은 7억5,000만 달러(약 1조125억 원) 상당이라고 미국 경제매체 CNBC는 전했다.

샘 올트먼 오픈AI 최고경영자. AFP 연합뉴스

오픈AI, 신조어 등 실시간 데이터 확보

이번 계약으로 오픈AI는 '살아 있는' 데이터를 대량으로 확보할 수 있게 됐다. 젊은 이용자가 많은 커뮤니티의 특성상 레딧에는 주제를 막론하고 실시간으로 이슈가 공유된다. 뉴스 기사 등 정제된 데이터에서는 제한적으로 얻을 수밖에 없는 신조어도 많다. 오픈AI는 페이스북·인스타그램 등을 운영하는 세계 최대 사회관계망서비스(SNS) 업체 메타, 산하에 유튜브를 둔 구글과 비교해 살아 있는 데이터를 얻기가 어렵다는 게 치명적 약점으로 꼽혀왔었다. 그러나 레딧과의 계약으로 경쟁사들을 바짝 쫓을 수 있게 됐다. 다만 레딧은 지난 2월 구글과도 라이선스 계약을 체결했다.

오픈AI는 저작권 침해 관련 사법 리스크를 없애고자 최근 콘텐츠 저작권자들과 콘텐츠 라이선스 계약을 확대하면서 훈련용 데이터를 '정당하게' 확보하고 있다. 지난달에는 130여 년의 역사를 가진 영국 파이낸셜타임스(FT)와 계약을 맺어 화제를 모았다.

실리콘밸리= 이서희 특파원 shlee@hankookilbo.com

Copyright © 한국일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?