"챗GPT 왜 공짜로 뉴스 썼나"…언론사들, 제값받기 나섰다 [팩플]

김남영 2023. 6. 19. 05:02
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

챗GPT가 학습한 뉴스 콘텐트의 값어치는 얼마일까. 인공지능(AI) 학습에 필요한 뉴스 콘텐트에 대한 사용료를 두고 빅테크 기업들과 미디어 기업들이 협상을 벌이고 있다.

로이터=연합뉴스


무슨 일이야


17일(현지시간) 파이낸셜타임스(FT)는 오픈AI, 마이크로소프트(MS), 어도비가 최근 언론사들과 만나 AI 학습을 위한 뉴스 콘텐트 사용 문제를 논의하고 있다고 보도했다. 오픈AI는 챗GPT, MS는 코파일럿, 어도비는 파이어플라이라는 생성 AI 제품을 보유하고 있다. FT는 “미국의 미디어그룹인 뉴스코퍼레이션, 뉴욕타임즈(NYT), 독일 악셀 스프링거, 영국 가디언 등의 언론사들은 각각 적어도 한 곳 이상의 기술 기업과 논의를 진행 중이다”고 전했다. 생성 AI 챗봇 ‘바드’를 서비스하는 구글 역시 영국 언론사와 협상 중인 것으로 알려졌다.

이게 왜 중요해


이들의 협상 결과에 따라 AI가 학습하는 뉴스 데이터의 가격이나 관련 시장 기준이 좌우될 수 있다. 그간 뉴스 콘텐트는 고품질 텍스트 데이터로 AI 학습에 활용되고 있지만, 기술 기업들이 이에 대한 대가를 지불하지 않고 사용해 논란이 됐다. 데이터 추적 플랫폼 어플라이드XL의 프란체스코 마르코니 최고경영자(CEO)에 따르면 챗GPT는 로이터, 뉴욕타임스, 워싱턴포스트(WP), 블룸버그, 월스트리트저널(WSJ) 등의 기사를 학습에 활용했다. 하지만 챗GPT 개발사인 오픈AI는 미디어에 AI 관련 뉴스 사용료를 내지 않고 있다.

월스트리트저널(WSJ)을 보유한 뉴스코퍼레이션의 제이슨 콘티 법률 고문은 지난 2월 “WSJ 소속 기자들이 작성한 기사를 활용해 AI를 학습시키려고 한다면 우리에게 허가를 받아야 한다”며 “오픈AI는 우리와 그런 계약을 맺지 않았다”며 문제를 제기했다. 전 세계 언론사 2000여 곳이 참여하는 뉴스미디어연합(INMA)은 AI 학습에 뉴스가 어느 정도 활용되고 있는지를 조사하고 있다.

AI 학습용 데이터를 둘러싼 논란은 뉴스 외에 다른 콘텐트 분야에서도 일어나고 있다. 게티이미지뱅크는 지난 1월 이미지 생성 AI 기업인 스태빌리티AI를 상대로 저작권 침해 소송을 제기했다. 일평균 5700만 명이 방문하는 미국 커뮤니티 사이트 레딧은 지난 4월 API(응용프로그램 인터페이스) 유료화 방침을 밝혔다. 더 이상 레딧의 데이터를 공짜로 AI에 줄 수 없다는 것이다.


앞으로는


AI 학습에 쓰이는 뉴스 콘텐트 사용료를 어떤 방식으로 책정하고, 어떻게 지불할지가 협상의 관건이 될 것으로 보인다. 마티아스 되프너악셀 스프링거 CEO는 FT에 “라디오나 스트리밍 서비스들이 음원을 재생할 때마다 음반사에 비용을 지불하는 것과 같은 정량적 모델이 우선 고려되고 있다”고 밝혔다. 이를 하기 위해선 AI 기업이 콘텐트 사용량과 출처를 공개해야 한다. 현재 이들은 AI가 어떤 재료로 얼마나 많이 학습했는지를 공개하지 않고 있다.

지불 방식도 관건이다. FT에 따르면 언론사들은 연간 500만~2000만달러(약 60억~250억원) 수준의 사용료를 제안한 것으로 알려졌다.


한국은 어때


네이버가 운영하고 있는 뉴스 서비스 화면. 네이버뉴스 캡처.
한국도 생성 AI 기업과 언론사 간 데이터 사용 문제로 갈등이 벌어졌다가 일단락된 바 있다. 지난 3월 네이버는 콘텐트 제휴를 맺은 언론사들에 ‘뉴스 콘텐츠 제휴 약관 개정안’을 일방적으로 전달했다. 초안에 네이버가 언론사 동의 없이 서비스 개발용 연구 목적으로 뉴스 콘텐트를 이용할 수 있도록 한 조항(제8조 3항)이 포함돼 있어 문제가 됐다. ‘포털의 뉴스 서비스용으로 제공한 텍스트 콘텐트를 네이버가 무단으로 AI 서비스 개발에 활용하려 한다’는 반발이 커지자 네이버는 동의 절차를 거치는 내용으로 약관을 수정했다. 네이버는 기존에 개발한 AI 언어모델 ‘하이퍼클로바’와 이를 기반으로 개발 중인 ‘하이퍼클로바X’의 학습에 네이버 뉴스를 활용하고 있다.

김남영 기자 kim.namyoung3@joongang.co.kr

Copyright © 중앙일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?