“긁어가지 마”… 세계 인기 웹 10%가 ‘챗GPT 접근금지령’

실리콘밸리/오로라 특파원 2023. 8. 29. 03:03
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

NYT·로이터 등 언론사가 앞장
아마존·이케아 유명 기업도 동참

수많은 웹사이트에서 텍스트·이미지를 긁어 와 학습하는 생성형 인공지능(AI)의 저작권 침해 우려가 커지면서 정보 제공을 원천 차단하는 웹사이트가 많아지고 있다.

27일(현지 시각) AI 콘텐츠 제공업체 ‘오리지널리티.AI’에 따르면, 지난 22일 기준 전 세계에서 가장 인기 있는 웹사이트 1000개 중 9.2%가 챗GPT의 정보 수집 툴 ‘GPT봇’을 차단하고 있는 것으로 나타났다.

앞서 지난 7일 챗GPT를 운영하는 오픈AI는 GPT의 대규모 언어 모델(LLM) 학습에 필요한 데이터를 수집하는 새로운 수집 툴 ‘GPT봇’을 공개하면서, 정보 수집을 원하지 않는 사이트 소유자에게 이를 차단할 수 있는 방법을 안내했다. 이후 첫 일주일에는 GPT봇 접근을 막는 사이트가 5% 수준이었지만, 현재는 10%에 육박하는 수준으로 늘어난 것이다. 오리지널리티.AI는 “일주일 사이 GPT봇의 접근을 막는 사이트가 5%포인트 늘어나는 등, 향후 이를 차단하는 사이트는 꾸준하게 많아질 것으로 보인다”고 전망했다.

오리지널리티.AI에 따르면, 인기 사이트 범위를 상위 100개로 좁힐 경우 차단율은 15%로 높아졌다. 방문자가 많은 사이트일수록 GPT를 차단하고 싶어 하는 소유주가 많다는 것이다. GPT봇 차단에 앞장선 것은 뉴욕타임스, 로이터통신, CNN, 비즈니스인사이더 같은 영미권 언론사들이다. 로이터는 세계 상위 100위권 웹사이트 가운데 가장 빨리 GPT봇을 차단하기도 했다. 앞서 지난 5월 구글이 뉴욕타임스와 뉴스 콘텐츠 사용료로 3년에 걸쳐 1억달러(약 1327억원)를 지급하기로 한 가운데, 사전 동의와 정당한 대가 없이 챗GPT가 콘텐츠를 무단으로 사용하게 둘 수 없다는 것이다.

아마존, 이케아, 에어비앤비 등 유명 기업들의 웹사이트도 GPT봇 접근을 차단했다. 테크 업계 관계자는 “대기업들은 GPT봇이 고객들의 정보를 그대로 긁어 가는 것에 대한 우려가 크다”며 “향후 오픈AI 같은 업체가 AI를 학습시키는 데 사용하는 데이터에 상응하는 비용을 지불해야 한다는 목소리가 더 커질 것”이라고 했다.

Copyright © 조선일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?