구글 부사장 “AI 학습 거부하는 기술 표준 만들어야”

검색엔진 무단 접근 막는 ‘로봇 배제 표준’
AI 학습 무단 사용 막도록 재정비 필요
학습 데이터 저작권 논란 불거지며 선제 대응

구글 부사장이 인터넷에 올린 콘텐츠가 인공지능(AI) 학습 데이터로 쓰이는 것을 거부하는 기술 표준을 만들어야 한다고 주장하고 나섰다.

지난 6일 다니엘 로맹 구글 부사장은 자사 블로그에 글을 올려 “로봇 배제 표준(robots.txt)을 AI 시대에 맞게 재정비해야 한다”고 밝혔다.

로봇 배제 표준은 1990년대 처음 만들어진 인터넷 규칙이다. 검색엔진이 웹사이트를 무단으로 탐색하는 것을 막기 위해 만들어졌다.

비록 강제성은 없지만 구글·네이버 등 대부분의 검색 엔진이 이를 준수하고 있어 사실상의 국제 표준으로 받아들여지고 있다.

사이트 운영자가 robots.txt라는 이름의 텍스트 파일을 저장해 놓으면, 그 안에 담긴 규칙에 따라 검색엔진이 사이트에 접근할지 말지를 판단하는 식으로 작동한다.

로맹 부사장은 “30년 전에 만들어진 로봇 배제 표준은 검색엔진의 콘텐츠 크롤링을 제어하는 간단하고 투명한 방법”이라며 “이제는 AI에 활용해도 되는지를 제어하기 위해 방법을 모색해야 한다”고 주장했다.

CNN 등에 따르면 지난달 미국 법무법인 클락슨은 오픈AI·마이크로소프트·구글 등 기업에 집단 소송을 제기했다. 클락슨은 홈페이지를 통해 “인터넷에 올라와 있는 수많은 글을 쓴 이들은 오픈AI가 자사의 이익을 위해 이런 정보들을 사용하는 것에 동의하지 않았다”고 주장했다.

또 월스트리트저널에 따르면 지난 5월 미국 뉴욕타임스는 구글로부터 3년간 뉴스 사용료 1억달러(약 1300억원)를 받기로 했다. 이외에도 파이낸셜타임스에 따르면 최근 영미권 언론사들이 오픈AI·마이크로소프트·어도비 등과 만나 연간 최대 2000만달러(약 260억원)의 뉴스 사용료를 제안한 것으로 알려졌다.

이에 구글은 이달 1일 약관을 변경해 “온라인에서 수집한 정보를 AI 학습에 사용할 수 있다”는 내용을 추가하기도 했다.

매일경제

IT/과학

구글 부사장 “AI 학습 거부하는 기술 표준 만들어야”