“왜 AI 훈련에 뉴스 무단 사용하나” 美 언론사들 소송 줄이어

실리콘밸리/오로라 특파원 2024. 5. 1. 09:23
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

美 뉴스 8개사, 오픈AI·MS 소송
구글은 뉴스코프에 연 600만 달러 내기로
오픈AI 로고/로이터

미디어와 테크기업 간 콘텐츠 저작권 싸움이 심화되는 가운데, 미디어와 손을 잡으려는 움직임도 늘어나고 있다. 인공지능(AI) 선두 기업인 오픈AI와 마이크로소프트(MS) 등을 대상으로 AI 훈련에 뉴스 기사·이미지 등을 무단으로 사용한 것을 지적하는 법적 소송이 늘어나면서 정당한 사용료를 지불하겠다는 협력 사례들이 나타나고 있는 것이다.

지난 30일 미국 대형 신문사 8곳은 오픈AI와 MS를 상대로 저작권 소송을 제기했다고 CNBC 등 외신이 보도했다. 소송에 참여한 신문가는 뉴욕 데일리 뉴스, 시카고 트리뷴, 올랜도 센티넬, 더 선 센티넬(플로리다), 머큐리 뉴스(캘리포니아), 덴버 포스트, 오렌지 카운티 레지스터, 세인트 폴 파이오니어 프레스(미네소타)로, 모두 헤지펀드 알덴 글로벌 캐피털이 소유한 매체들이다.

이날 뉴욕 남부지방 법원에 제출된 소장에 따르면 이들 회사들은 오픈AI의 챗GPT와 MS의 코파일럿 등 다수 AI 제품들이 훈련에 수백만 건의 기사를 불법적으로 복사해서 사용했다고 주장하고 있다. 이들은 소송에서 구체적인 금전적 손해배상을 요구하지 않았으나, 배심원 재판을 요구하며 미디어 기업들이 콘텐츠 사용에 대한 보상을 받아야한다고 명시했다.

이들 회사들은 “AI챗봇이 구독해야만 볼 수 있는 뉴스 기사들을 무료로 표시하고, 출처 링크를 표기하지 않은 경우도 다수”라며 “이로 인해 독자들이 지역 신문에 구독료를 지불해야할 필요성이 줄었고, 신문사들은 수익을 잃게됐다”고 지적했다. 알덴 글로벌 캐피털 측은 이날 “우리는 정보를 수집하고 뉴스를 보도하는데 수십억 달러를 소비하고 있는데, 이를 오픈AI와 MS가 자체 비즈니스 구축을 위해 훔쳐가는 것을 허용할 수 없다”고 밝혔다.

◇미디어와 손 잡은 테크 기업들

지난 12월 뉴욕타임스가 오픈AI와 MS가 자사 콘텐츠를 무단으로 사용해 AI를 훈련시켰다고 소송을 제기했었다. 뉴욕타임스의 뒤를 따른 소송건이 늘어나자, 테크 기업들은 미디어 기업들과 법적 다툼을 이어가는 대신 협력 방법을 모색하는 쪽으로 기울고 있다. 실제로 이번 소송에 대해 오픈AI 대변인은 성명을 내고 “뉴스 파트너들과 함께 협력 관계를 구축할 수 있는 잠재력을 보고 있다”며 협력 기획를 모색하겠다고 밝히기도 했다.

구글 로고./로이터

같은 날 AI의 또 다른 선두 기업인 구글은 세계 최대 미디어그룹인 미국의 뉴스코퍼레이션(이하 뉴스코프)과 AI콘텐츠 및 제품 개발을 위한 계약을 체결했다고 IT전문매체 디인포메이션이 보도했다. 뉴스코프는 미 월스트리트저널(WSJ)을 발행하는 다우존스와 미국 대형 출판사 하퍼콜린스, 영국 더 타임스, 호주 유로 방송 등의 모회사다. 보도에 따르면 구글은 자사 AI모델을 강화하기위해 WSJ 등 매체의 콘텐츠를 이용하고, 이를 대가로 뉴스코프에 연간 500만~600만 달러(약 83억원)을 지급하기로 했다. 디 인포메이션은 “구글은 뉴스 링크를 제공하는 것에 대한 지출을 아끼려고 하고 있지만, AI관련 업무에선 미디어들과 거래를 늘리려고 하고 있다”고 평가했다.

이에 앞서 지난 29일에는 영국 일간지 파이낸셜타임스(FT)가 오픈AI와 콘텐츠 이용 및 AI 기능 개발을 위한 파트너십을 체결하기도 했다.

◇일각에선 “계약이 독이 될수도”

테크 기업들이 미디어사들과 우호적인 관계를 맺으려는 것에 대해 테크 업계에선 “AI 훈련에 쓸 수 있는 양질의 데이터가 급격하게 부족해지고 있기 때문”이라는 평가가 나온다. 오픈AI·구글 등이 개발하고 있는 차세대 AI에는 지금 시중에 나와 있는 AI보다도 훨씬 많은 데이터가 사용되는데, 이미 온라인상에서 찾을 수 있는 대부분 뉴스 콘텐츠, 저서 등 정교한 데이터들은 사용됐었다. 이에 따라 미디어사들이 만들어내는 새로운 콘텐츠들을 문제 없이 AI훈련에 사용할 수 있는 계약을 맺는게 테크 기업들에도 중요해졌다는 것이다.

하지만 일각에선 미디어와 테크 기업간의 계약에서 뉴스의 가치가 너무 저평가됐다는 우려도 나오고 있다. 디인포메이션은 “테크 업테들이 뉴스 콘텐츠에 너무 적은 가치를 부여한다”며 “올해 CNN이 오픈AI와 협상했을 때 제안됐던 조건은 단어당 ‘1페니 미만’의 가치를 부여하는것으로 알려졌고, CNN 경영진은 이 가격이 콘텐츠 가치보다 훨씬 낮다고 판단했다”고 전했다. 이와 함께 당장은 수백만 달러 단위의 연간 수익이 늘어나지만, 장기적으로 봤을땐 뉴스가 AI에 제공되면서 미디어사에 구독자 이탈 등 잠재적 피해가 이어질 것이라는 우려도 여전하다.

Copyright © 조선일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?