공짜로 뉴스 긁어 쓰는 빅테크 AI… 美·유럽 “사용료 내라”

임경업 기자 2023. 8. 26. 03:02
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

개발사 상대로 줄소송 예고
네이버 최수연 대표가 24일 서울 강남구 그랜드인터컨티넨탈 서울파르나스에서 열린 콘퍼런스에서 네이버의 AI ‘클로바X’를 소개하고 있는 모습./뉴스1

챗GPT와 같은 생성형 AI(인공지능)가 확산되는 가운데 전 세계 주요 언론사들이 “뉴스 저작권을 무단으로 사용하지 말라”며 제동을 걸고 있다. 챗GPT 이후 쏟아지는 생성형 AI들이 언론사의 허락 없이 뉴스 기사들을 학습시키자 정당한 사용료를 내라고 주장한 것이다. 일부에선 법정 소송까지 예고하고 있다.

지난 23일(현지 시각) 영국 디지털·문화·미디어·스포츠부는 주요 미디어 매체 경영진에게 보낸 서한에서 “AI가 기사·콘텐츠를 비롯한 지식재산 저작권을 침해하는 사실에 대한 심각성을 정부도 인지하고 있다”며 “AI 저작권 침해를 방지하고 이에 대처할 강력한 수단을 마련하겠다”고 했다. 앞서 5월에는 영미권 대표 미디어그룹들이 콘퍼런스를 열고, AI 대응을 논의했다. 이 자리에서 로버트 톰슨 뉴스 코프 최고경영자는 “미디어들의 집단 지식재산권(뉴스 기사)이 AI의 위협을 받고 있으며, 저널리즘이 훼손되고 있다”며 “마땅한 보상을 받기 위해 소리 높여 목소리를 내야 한다”고 말했다.

한국도 24일 네이버가 챗GPT의 대항마로 내놓은 AI ‘클로바X’에 언론사들의 뉴스가 대량 사용됐다. 한국신문협회는 성명을 내고 “AI 개발에 뉴스를 사용하는 것은 광범위한 저작권 침해 행위이자 뉴스 가치 훼손”이라며 네이버·카카오·구글코리아·MS(마이크로소프트) 등 테크 기업을 상대로 저작권자와 이용 기준 협의·학습 데이터 출처 공개·뉴스 저작권자에 대한 보상 체계 마련 등을 골자로 한 요구 사항을 전달했다.

◇뉴스 무단으로 긁어 쓴 AI

뉴스는 AI 학습의 핵심 수단이다. 챗GPT처럼 인간의 언어를 이해하고 구사하는 대규모 언어 모델(LLM)에 기사를 입력하면 AI가 스스로 단어와 문장의 연결 규칙, 기사에 언급된 내용과 사건의 맥락들을 파악한다. 이후 사용자가 질문을 하면, 이 데이터를 기반으로 답을 내놓는다. 고도로 정제된 뉴스 기사의 논리 전개와 문장 배치 등은 AI의 언어 구사력에 결정적인 영향을 미친다. 최수연 네이버 대표도 최근 클로바X 발표 현장에서 “뉴스가 AI 학습과 개발에 필요한 가장 고품질 데이터인 것은 맞는다”고 했다.

그래픽=이철원

문제는 AI 개발사들이 언론사들과 충분한 협의와 비용 정산 과정 없이 뉴스 데이터를 가져가고 있다는 것이다. 챗GPT는 뉴욕타임스·월스트리트저널·가디언·CNN 등 주요 매체의 기사 데이터를 학습한 것으로 알려졌다. 챗GPT를 개발한 오픈AI는 일종의 자동 프로그램(봇)을 이용해 문자로 된 뉴스를 수집했다. 챗GPT의 무단 기사 수집이 논란이 되자 로이터·NYT·CNN 등 주요 매체들은 이달 각 뉴스·블로그 사이트에서 챗GPT가 임의로 기사를 수집하지 못하게 막았다.

◇미국은 소송 예고, 한국도 대응 나서

미국에선 테크 기업과 개별 언론사의 협상이 이미 시작됐다. 언론사들은 협상이 결렬되면 적극적인 소송으로 대응하겠다는 입장이다. 구글은 적극적으로 ‘돈을 내서라도 뉴스 데이터를 사겠다’는 입장이다. 구글은 뉴욕타임스에 3년간 1억달러(약 1300억원)를 내고 기사 데이터를 구매하기로 했다. 구글과 달리 자금력이 부족한 오픈AI는 타협점을 찾지 못하고 있다. 월스트리트저널과 뉴욕타임스가 오픈AI를 상대로 소송을 제기할 예정이다.

한국 미디어 업계도 데이터 무단 사용에 대한 대응을 검토하고 있다. 언론사 뉴스가 네이버의 클로바X 학습에 사용됐기 때문이다. 네이버에는 수십년 치 분량에 해당하는 언론사 뉴스 데이터가 보관돼 있다. 네이버는 언론사들의 뉴스를 서비스하면서 비용을 내고 있다는 입장이다. 하지만 신문협회는 “이는 뉴스 서비스를 통한 정보 제공 대가를 통한 수익 배분이고, 각 언론사 데이터가 AI 학습용으로 쓰이는 것은 계약 밖의 일”이라며 “뉴스 저작물을 AI에 사용하는 것에 대한 명확한 기준을 만들고, 언론사와 협의해 데이터 활용 대가를 지급해야 한다”고 밝혔다. 최수연 네이버 대표는 “(언론사들과) 긴밀하게 협의하고, 모두가 윈-윈 할 수 있는 논의를 하겠다”며 “추이에 따라 적극적으로 규제를 따르겠다”고 했다.

권헌영 고려대 교수는 “국내 IT 기업들도 속속 한국어 기반 AI 서비스를 개발하고 있고, 뉴스 데이터는 AI에 반드시 필요하다”며 “국가산업 경쟁력과 직결되는 AI를 일종의 인프라로 접근하고, 데이터 제공자들에 대한 적절한 보상 논의가 국가적으로 이뤄져야 할 것”이라고 말했다.

Copyright © 조선일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?