"공짜는 안 돼"…늘어나는 챗GPT 차단 사이트
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
생성형 인공지능(AI)이 확산되면서 저작권 문제도 불거지고 있다.
챗GPT의 정보 수집을 차단하는 사이트가 늘고 있는 것도 이런 맥락에서다.
AI에 따르면 지난 22일 기준 전 세계에서 가장 인기 있는 사이트 1000개 가운데 챗GPT의 정보 수집 툴인 GPT봇(GPTBot)을 차단한 사이트는 9.2%에 달했다.
오픈AI는 GPT봇을 공개하면서 정보 수집·이용을 원하지 않는 사이트 소유자에게 GPT봇의 크롤링을 차단하는 방법을 안내했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
생성형 인공지능(AI)이 확산되면서 저작권 문제도 불거지고 있다. 생성형 AI들이 무차별적으로 수집한 정보에는 저작권이 포함돼 있기 때문이다. 챗GPT의 정보 수집을 차단하는 사이트가 늘고 있는 것도 이런 맥락에서다.
27일(현지시간) AI 콘텐츠 정보 제공업체인 오리지널리티.AI에 따르면 지난 22일 기준 전 세계에서 가장 인기 있는 사이트 1000개 가운데 챗GPT의 정보 수집 툴인 GPT봇(GPTBot)을 차단한 사이트는 9.2%에 달했다.
GPT봇은 챗GPT 개발사 오픈AI가 GPT 언어모델 학습에 필요한 데이터를 수집하는 새로운 웹 크롤러로, 지난 7일 공개됐다.
오픈AI는 GPT봇을 공개하면서 정보 수집·이용을 원하지 않는 사이트 소유자에게 GPT봇의 크롤링을 차단하는 방법을 안내했다.
GPT봇 공개 후 첫 주인 지난 15일에는 GPT봇 차단율이 5%에 미치지 않았으나, 2주 차에는 10%까지 육박했다.
특히, 인기 있는 주요 사이트 100개로 범위를 좁히면 차단율은 15%에 달해 이용자 수가 많은 사이트일수록 차단율이 높은 것으로 조사됐다.
주요 사이트 중에는 로이터 통신, 아마존, 뉴욕타임스, CNN방송( 등 주요 기사 사이트가 대거 포함됐다.
로이터 통신의 경우 주요 GPT봇 공개 다음 날인 8일 웹 크롤링을 차단해 주요 100개 사이트 중에는 가장 먼저 정보 수집을 막았다.
이처럼 각 사이트가 GPT봇을 차단하는 것은 자사와 사전 동의 없이 챗GPT가 콘텐츠를 무단으로 사용하지 못하도록 하기 위한 것이다. 구글의 경우 지난 5월 NYT와 뉴스콘텐츠 사용료로 3년에 걸쳐 1억 달러(1327억원) 지급하기로 하는 합의한 것으로 알려졌다.
오리지널리티.AI는 "GPT봇 접근을 막는 사이트가 일주일에 5% 포인트가량 늘어나는 등 GPT봇 차단 사이트는 꾸준히 늘어나는 것으로 조사됐다"고 설명했다
강현철기자 hckang@dt.co.kr
Copyright © 디지털타임스. 무단전재 및 재배포 금지.
- "아이가 빠졌어요" 엄마 비명소리…열차 승객들 온몸으로 구했다
- 세차장 앞에서 속옷 내리고 음란행위 40대…또다시 실형
- "여친 폭행 사실 들킬까 봐"…때리고 나흘 동안 감금한 30대의 최후
- `부릅뜬 눈` 트럼프 머그샷 대박…100억원 단숨에 모였다
- "농사지으며 함께 살겠다" 40대女, 작심하고 돈만 뜯어내…징역 10개월
- 韓 "여야의정 제안 뒤집고 가상자산 뜬금 과세… 민주당 관성적 반대냐"
- [트럼프 2기 시동] 트럼프, 김정은과 협상할까… "트럼프 일방적 양보 안 할 것"
- 내년 세계성장률 3.2→3.0%… `트럼피즘` 美 0.4%p 상승
- `범현대 3세` 정기선 수석부회장, HD현대 방향성 주도한다
- "AI전환과 글로벌경쟁 가속… 힘 합쳐 도약 이뤄야"