“AI 훈련에 뉴스 기사 무단 사용” 美 신문사들, MS·오픈AI에 소송

실리콘밸리/오로라 특파원 2024. 5. 2. 01:43
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

시카고트리뷴 등 유력지 8곳
오픈AI 로고./AFP 연합뉴스

미국 유력 일간지 8곳이 생성형 인공지능(AI) 챗GPT를 개발한 ‘오픈AI’와 이 회사 최대 주주인 마이크로소프트(MS)를 상대로 콘텐츠 불법 사용에 대한 소송을 제기했다. AI 서비스 모델을 개발하려면 방대한 데이터를 학습시켜야 하는데, 이때 자사 뉴스를 무단으로 사용했다는 것이다.

지난 30일 시카고트리뷴, 덴버포스트, 뉴욕데일리뉴스 등 8사는 “오픈AI와 MS가 AI 서비스 모델을 개발하면서 자사가 저작권을 가진 기사 수백만 건을 무단 사용했다”며 뉴욕 남부 연방법원에 소장을 제출했다. 한 펀드가 소유하고 있는 이 8사는 소장에 구체적인 피해 보상 금액을 적시하지는 않았지만, 오픈AI와 MS가 콘텐츠 사용에 대한 정당한 보상을 해야 한다고 주장했다. 이 매체들은 성명을 내고 “우리는 정보를 수집하고 뉴스를 보도하기 위해 수십억 달러(수조 원)를 쓴다”며 “오픈AI와 MS가 우리의 저작물을 훔쳐 빅테크 사업을 구축하고 확장하는 것을 용납할 수 없다”고 밝혔다.

이번 소송은 지난해 12월 뉴욕타임스, 지난 2월 미국 온라인 매체들이 오픈AI를 상대로 비슷한 내용의 소송을 제기한 후 2개월 만의 일이다. 미디어와 AI 기업 간에 이 같은 소송은 더 빈번해질 전망이다. 뉴스는 오류가 적고 표현이 정제돼 있을 뿐 아니라, 논문·백과사전과 달리 최신 정보가 실시간으로 업데이트되는 만큼, AI 학습에 가장 이상적인 콘텐츠로 여겨진다. 하지만 이에 대해 AI 기업들이 얼마만큼 보상해야 하는지에 대한 사회적 합의는 없다. 정명수 KAIST 전기및전자공학부 교수는 “챗GPT 같은 범용 AI의 경우엔 다른 콘텐츠보다 뉴스 학습량이 더 많다”며 “미디어와 테크 기업 간에 협력 방안을 모색하고 법적 제도 장치도 마련해야 한다”고 말했다.

그래픽=양인성

시카고트리뷴과 뉴욕데일리뉴스 등 일간지 8사는 법원에 제출한 소장에서 “오픈AI의 챗GPT와 MS의 챗봇인 코파일럿이 기사 전문을 자신들의 허락 없이 무단으로 보여준다”고 지적했다. 이 일간지들은 뉴스를 유료로 제공하고 있는데, AI 챗봇이 기사 전문을 무료로 보여주면 독자들이 신문사에 구독료를 지불해야 할 필요성이 줄어들고, 결국 신문사의 수익에 직접적인 타격을 준다는 것이다.

이들은 또 AI가 뉴스 콘텐츠를 잘못 짜깁기해서 엉뚱한 대답을 내놔 신문사들의 신뢰성을 추락시킨다고 했다. 소장에 따르면, 챗GPT는 유아용 의자를 추천해 달라는 질문에 ‘시카고트리뷴이 추천했다’며 특정 제품을 제시했는데, 영아 사망 사고로 리콜된 제품이었다. 시카고트리뷴이 이런 추천을 한 적은 없었다. 또 덴버포스트가 ‘흡연은 잠재적으로 천식을 치료할 수 있다는 연구 결과가 나왔다’고 보도했다는 잘못된 응답을 내놓기도 했다. 신문사들은 “챗봇의 답변이 신문의 평판을 훼손하고 위험한 정보를 퍼뜨리고 있다”며 “이는 신문업계의 문제만이 아닌, 미국 시민들의 생활에 매우 중요한 문제”라고 지적했다.

일부 빅테크는 이런 문제 때문에 미디어 기업과 콘텐츠 사용 협의를 보려는 시도를 하고 있다. 지난 30일 IT 전문 매체 디인포메이션에 따르면, 구글은 월스트리트저널(WSJ), 더타임스 등을 소유한 세계 최대 미디어 그룹인 뉴스코퍼레이션의 콘텐츠를 AI 모델 훈련에 사용하는 대가로 연간 500만~600만달러(약 83억원)를 지급하기로 했다. 지난 29일에는 오픈AI가 영국 일간지 파이낸셜타임스(FT)와 콘텐츠 이용 및 AI 개발을 위한 파트너십을 체결하기도 했다.

일각에선 미디어와 테크 기업 간의 계약에서 뉴스 가치가 저평가됐다는 우려가 나온다. 디인포메이션은 “올해 CNN방송이 오픈AI와 파트너십 협상을 했을 때 단어당 ‘1페니 미만’의 가치를 쳐준다는 조건이 오갔다”며 “이는 연간 수백만 달러 수준의 비용을 지불하겠다는 의미지만, CNN 경영진은 이 가격이 자사 콘텐츠 가치보다 훨씬 낮다고 판단했다”고 전했다. 당장 연간 수백만 달러 수준의 수익이 늘지만, 미디어 구독자 이탈 등 이후 발생할 잠재적 피해를 감안하면, 현재 수준의 가치만 받아서는 손해가 될 수도 있다는 것이다. 미 싱크탱크 브루킹스연구소는 “AI는 언론인과 다르게 감옥에서 피고인을 인터뷰하거나, 총격 사건 피해자의 부모를 만날 수도 없다. (수익성 하락으로) 인간이 만든 고품질 콘텐츠가 줄어들면 결국 AI 서비스의 성능이 저하될 것”이라며 “뉴스가 AI 훈련에 사용되는 필수 데이터인 만큼, 언론 콘텐츠를 별다른 보상 없이 사용하는 관행이 바뀌어야 한다”고 진단했다.

Copyright © 조선일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?