‘난 되지만 넌 안돼’ AI 빅테크의 내로남불

실리콘밸리/강다은 특파원 2025. 12. 21. 15:17
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

데이터 크롤링 욕먹던 구글, 다른 업체 고소
그래픽=김현국·미드저니

구글이 구글 검색 결과에 포함된 콘텐츠를 대량으로 추출·재판매한 회사를 상대로 소송을 제기했다. 앞서 구글은 AI(인공지능) ‘제미나이’를 개발할 때 언론사 뉴스와 도서 콘텐츠 등을 무단으로 사용했다는 이유로 소송을 당했는데, 자사 콘텐츠를 사용한 다른 회사에는 강경한 법적 대응에 나선 것이다. 이에 테크업계 일각에서는 “거대 AI 기업의 ‘내로남불’과 다름없는 이중적 행태”라고 비판한다.

◇AI 기업들의 ‘내로남불’

19일(현지 시각) 구글은 스타트업 ‘서프Api’가 저작권을 침해하고 있다며 캘리포니아 북부 연방지법에 소송을 제기했다. 서프Api는 크롤링(crawling), 데이터 스크래핑(data scraping) 회사로 알려져 있다. 크롤링은 수많은 인터넷 사이트를 돌아다니며 웹페이지를 통째로 긁어모으는 자동화 기술을 뜻한다. 데이터 스크래핑은 웹페이지에서 검색 결과, 가격, 리뷰, 기사 본문 등 특정 데이터를 추출·재사용하는 것을 말한다. 크롤링이 웹을 돌아다니며 정보를 ‘찾는’ 과정이라면, 데이터 스크래핑은 필요한 데이터를 뽑아내 재사용하는 것이다. 이렇게 모은 데이터는 검색 결과를 생성하거나 AI 모델 훈련 등에 사용된다. 구글은 이번 소송에서 데이터 스크레이핑을 문제 삼고 있다.

구글은 소장에서 “서프Api가 구글의 보안 시스템을 무단으로 우회해 수억 건의 가짜 검색 요청을 보내 데이터를 수집했다”고 주장했다. 또 “구글이 다른 곳에서 라이선스를 받아 제공하는 콘텐츠를 서프Api가 무단으로 가져가 유료로 재판매하고 있다”고도 했다. 구글은 서프Api의 개별 위반 사항 각각에 대한 손해배상액을 200∼2500달러로 산정하면서 “서프Api의 사업 모델은 ‘기생충’ 같다”며 강도 높게 비판했다.

앞서 지난 10월 구글은 여러 크롤링 기업이 구글 콘텐츠를 무단으로 가져가 경쟁 업체인 퍼플렉시티의 AI 학습용 자료로 판매한다고 주장하기도 했다.

◇”빅테크들도 데이터 무단 수집”

구글은 스스로 ‘규칙을 지키는 착한 데이터 수집가’라고 주장하지만, 동의받지 않은 데이터를 자사 AI 학습에 썼다는 이유로 소송을 당하고 있다. 예컨대 지난 9월 시각 예술가들은 구글을 상대로 저작권 침해 소송을 제기했다. 구글의 이미지 생성 AI가 저작권을 무시한 채 이미지 데이터를 수집해 학습에 활용했다는 주장이다. 미국의 개인 사용자들도 구글이 웹 데이터·개인 정보를 AI 학습 및 상업적 목적에 활용하면서 충분한 동의를 받지 않았다고 주장하며 집단소송을 내기도 했다.

이 때문에 테크 업계에서는 구글의 서프Api 상대 소송이 ‘내로남불’이라는 지적이 나온다. AI 고도화를 위해선 AI 학습에 쓸 다양한 데이터가 중요하다 보니, AI 기업들이 가능한 한 많은 데이터를 모으려는 동시에 자신의 데이터는 다른 AI 기업이 쓰지 못하도록 막는 것이다.

일론 머스크 테슬라 최고경영자(CEO)는 2023년부터 “데이터 약탈을 막겠다”며 X(옛 트위터)의 API를 유료화하고 “무단 크롤링에 대해 소송을 불사하겠다”고 엄포를 놨다. 그러나 정작 자신이 세운 xAI에서 개발 중인 ‘그록’ AI를 학습시키기 위해 X 사용자들의 방대한 데이터를 활용하고 있다. 메타도 페이스북과 인스타그램 등 자사가 운영 중인 소셜미디어(SNS)의 데이터를 크롤링하는 업체들에 대해 비판을 이어가지만, 정작 자사 AI 학습을 위해 불법 복제된 도서·기사 콘텐츠를 수집한 것으로 나타났다. 이에 미국 작가와 프랑스 출판사 단체가 메타를 상대로 집단소송을 제기했다.

빅테크의 이중적 행태는 데이터 크롤링에만 국한된 것은 아니다. 세계 최대 전자상거래 업체 아마존은 챗GPT, 퍼플렉시티 등 외부 AI 에이전트의 아마존 접근을 차단했다.

Copyright © 조선일보. 무단전재 및 재배포 금지.