“공짜로 정보 수집 금지”...아마존·NYT 등 챗GPT 차단 사이트 늘어

정미하 기자 2023. 8. 28. 07:25
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI) 열풍을 일으킨 '챗GPT'의 성능 향상을 위해선 방대한 양의 데이터가 필요하다.

하지만 아마존, 뉴욕타임스(NYT) 등을 포함한 수십 개의 미국 대형 기업과 언론사 등은 '챗GPT'가 정보를 수집하지 못하도록 차단하고 나섰다.

오픈AI는 GPT봇을 공개하면서 정보 수집과 이용을 원하지 않는 사이트 소유자에게 GPT봇의 크롤링을 차단하는 방법을 안내했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

인공지능(AI) 열풍을 일으킨 ‘챗GPT’의 성능 향상을 위해선 방대한 양의 데이터가 필요하다. 하지만 아마존, 뉴욕타임스(NYT) 등을 포함한 수십 개의 미국 대형 기업과 언론사 등은 ‘챗GPT’가 정보를 수집하지 못하도록 차단하고 나섰다.

25일(현지 시각) 비즈니스인사이더는 AI 콘텐츠 정보 제공업체인 오리지널리티.AI(originality.ai)를 인용해 지난 22일 기준 전 세계에서 가장 인기 있는 사이트 100개 가운데 15% 이상이 챗GPT의 정보 수집 수단인 ‘GPT봇(GPTBot)’을 차단하기로 결정했다고 보도했다. 상위 1000개 사이트 중에서 GPT봇을 차단한 사이트는 9.2%다.

생성형 인공지능(AI) 서비스를 만든 오픈AI 로고. / AP 연합뉴스

현재 GPT봇을 차단하는 상위 6개 주요 사이트에는 아마존, NYT, CNN, 셔터스톡, 위키하우 등이 포함돼 있다. 이외에도 블룸버그, 로이터, 비즈니스인사이더, 이케아, 에어비앤비, 악시오스, 코세라, 론니플래닛 등도 GPT봇을 차단했다.

GPT봇은 챗GPT를 개발한 오픈AI가 언어모델 학습에 필요한 데이터를 수집하는 새로운 웹 사이트로 지난 7일 공개됐다. 오픈AI는 GPT봇을 공개하면서 정보 수집과 이용을 원하지 않는 사이트 소유자에게 GPT봇의 크롤링을 차단하는 방법을 안내했다.

GPT봇 차단율은 공개 후 첫 주인 지난 15일, 5%에 미치지 않았으나, 2주 차에는 10%까지 올라갔다. 특히, 이용자 수 등이 많은 주요 100개 사이트로 한정하면 차단율은 15%에 달한다.

주요 사이트가 GPT봇을 차단하는 것은 저작권을 보호하기 위한 조치다. 비즈니스인사이더는 “인터넷에서 사용할 수 있는 대부분의 콘텐츠, 특히 텍스트와 이미지는 저작권의 보호를 받는다”며 “GPT봇과 같은 크롤러는 추출한 데이터나 정보를 사용하기 위해 허가, 라이센스 또는 비용을 요구하지 않는다”고 말했다.

- Copyright ⓒ 조선비즈 & Chosun.com -

Copyright © 조선비즈. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?