"챗GPT에 공짜 데이터 못준다"
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
챗GPT의 정보 수집을 차단하는 사이트가 늘고 있다.
27일(현지시간) 영국 가디언과 관련 업계에 따르면 AI 콘텐츠 정보 제공업체 오리지널리티AI는 지난 22일 기준 전 세계에서 가장 인기 있는 사이트 1000개 가운데 챗GPT의 정보 수집 툴인 'GPT봇'을 차단한 사이트가 9.2%에 달한다고 밝혔다.
오픈AI는 7일 GPT봇을 공개하면서 정보 수집·이용을 원하지 않는 사이트 소유자에게 이를 차단하는 방법도 안내했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
데이터 수집하는 GPT봇 차단
챗GPT의 정보 수집을 차단하는 사이트가 늘고 있다. 생성형 인공지능(AI)이 창작물의 저작권을 침해한다고 판단하는 기업이 많아진 영향이다.
27일(현지시간) 영국 가디언과 관련 업계에 따르면 AI 콘텐츠 정보 제공업체 오리지널리티AI는 지난 22일 기준 전 세계에서 가장 인기 있는 사이트 1000개 가운데 챗GPT의 정보 수집 툴인 ‘GPT봇’을 차단한 사이트가 9.2%에 달한다고 밝혔다. GPT봇은 챗GPT를 개발한 오픈AI가 GPT 언어모델 학습에 필요한 데이터를 수집하는 웹 크롤러다.
오픈AI는 7일 GPT봇을 공개하면서 정보 수집·이용을 원하지 않는 사이트 소유자에게 이를 차단하는 방법도 안내했다. GPT봇 공개 후 첫 주인 15일 GPT봇 차단율은 5% 미만이었으나 2주 차에 10%에 육박했다. 특히 인기 사이트 범위를 상위 100개로 좁히면 차단율이 15%까지 치솟았다. 이용자가 많은 사이트일수록 차단율이 높다는 의미다.
접속을 차단한 주요 사이트는 뉴욕타임스(NYT)와 로이터, 아마존, CNN방송 등이다. 특히 언론사들이 차단에 적극적으로 나섰다. 로이터통신은 주요 GPT봇 공개 다음 날인 8일 웹 크롤링을 차단해 주요 100개 사이트 중 가장 먼저 정보 수집을 막았다. 로이터 관계자는 “지식재산권은 사업의 생명선”이라고 설명했다. 구글은 지난 5월 NYT와 뉴스 콘텐츠 사용료로 3년에 걸쳐 1억달러를 지급하기로 합의했다.
네이버가 하이퍼클로바X를 내놓은 한국에서도 이와 비슷한 논란이 불거지고 있다. 한국신문협회는 최근 네이버, 카카오, 구글코리아 등을 상대로 저작권자와 이용 기준 협의, 학습 데이터 출처 공개, 보상 체계 마련 등을 요구하고 나섰다.
실리콘밸리=최진석 특파원 iskra@hankyung.com
▶ 클래식과 미술의 모든 것 '아르떼'에서 확인하세요
▶ 한국경제·모바일한경·WSJ 구독신청하기
Copyright © 한국경제. 무단전재 및 재배포 금지.
- 단팥빵으로 美 사로잡더니…조지아주에 공장 짓는 'K베이커리' [한경제의 신선한 경제]
- "일본車 독무대였는데"…현대차, 인니서 '전기차 1위' 쾌거
- "강남 출퇴근 편하고 집값도 싸다"…젊은 부부들 몰리는 동네
- "손자 잃은 할머니 사건 보고 개발"…'급발진 확인장치' 대상
- 한국사 일타 전한길, 홍범도 즉답 피하자…"2찍이냐" 비판
- 이다영 "김연경, 사과문 올리면 비밀 지켜주겠다"…또 저격글
- "피부과 900만원"vs"두 얼굴 남편"…촬영 중단, 역대급 '결혼지옥'
- 月 3억 받으려다…케빈 코스트너 전처, 막장 양육비 소송 '패소'
- "1박에 1000만원"…제니가 묵은 '그 호텔' 어딘가 봤더니
- 석 달 만에 BMW 제쳤다…1위 다시 차지한 수입차 브랜드