작가 허락 없이 중고책 수백만 권 스캔해 학습한 AI, 문제 없다?
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
생성형 AI 챗봇 서비스 클로드를 운영 중인 앤트로픽이 2024년 중고책 수백만 권을 구입해 이를 AI 학습에 활용하는 '프로젝트 파나마'를 운영한 사실이 드러났다.
미국 법원에선 중고책을 AI 학습에 이용하는 것이 합법이라는 판결이 나왔지만, 앤트로픽이 수백만 권의 중고책을 학습에 이용했다는 것이 밝혀지면서 비판이 제기되고 있다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
[AI 미디어 파도] 앤트로픽, 중고책 AI 학습 위한 '프로젝트 파나마' 가동
중고책 절단·스캔해 학습, 남은 책은 재활용… "윤리적 문제 있다"
[미디어오늘 윤수현 기자]

생성형 AI 챗봇 서비스 클로드를 운영 중인 앤트로픽이 2024년 중고책 수백만 권을 구입해 이를 AI 학습에 활용하는 '프로젝트 파나마'를 운영한 사실이 드러났다. 미국 법원에선 중고책을 AI 학습에 이용하는 것이 합법이라는 판결이 나왔지만, 앤트로픽이 수백만 권의 중고책을 학습에 이용했다는 것이 밝혀지면서 비판이 제기되고 있다.
워싱턴포스트는 지난달 27일 보도를 통해 앤트로픽이 중고책을 AI 학습에 어떻게 활용했는지 밝혀냈다. 앤트로픽이 2023년부터 중고책 학습을 위한 '프로젝트 파나마'를 가동했다는 것이다. 앤트로픽은 클로드 등 AI 서비스를 학습시킬 데이터가 필요했지만 출판사·작가에게 책 학습 동의를 얻는 것이 불가능하다고 판단했고 이에 저작자 동의 없이 중고책을 다량 구매해 이를 AI 학습에 활용하겠다는 계획을 세웠다.
앤트로픽은 내부 문서에서 '프로젝트 파나마'에 대해 “전 세계 모든 책을 스캔하려는 것이다. 이 프로젝트가 외부에 알려지는 것을 원치 않는다”고 밝혔다. 워싱턴포스트는 “2023년 1월 앤트로픽 창업자들은 AI 모델에 책을 학습시킨다면 저급 인터넷 용어 대신 글을 잘 쓰는 법을 가르칠 수 있다고 봤다”고 밝혔다.
앤트로픽은 2024년부터 중고책 수집을 시작했다. 앤트로픽은 중고책 판매 서점과 뉴욕 공립도서관 등 적자에 시달리는 도서관에 접촉해 책을 구매하는 방안을 논의했다. 결국 앤트로픽은 수백만 권에 달하는 중고책을 확보했고, 외부업체를 고용해 중고책을 디지털화했다. 유압식 절단기로 책을 분리하고, 이를 스캔해 AI 학습에 활용한 것이다. 학습이 끝난 책은 재활용 업체에 넘겨졌다. 앤트로픽이 학습한 책 양은 확인되지 않았지만, 워싱턴포스트는 수백만 권의 책이 학습에 활용됐다고 밝혔다.
앤트로픽은 작가와 출판사의 동의를 받지 않았지만, 미국 법원은 '프로젝트 파나마'가 법적으로 문제가 없다고 판단했다. 미국 캘리포니아주 북부지방법원은 지난해 6월 앤트로픽이 AI 학습을 위해 저작권자 허가 없이 도서를 활용한 것은 합법이라고 판결했다. 법원은 이 사건을 “매우 혁신적인 일”이라고 평가했으며, 중고책을 통한 AI 학습에 대해 “작가가 되고 싶어 (책을 구매하는) 독자와 마찬가지로, 앤트로픽은 다른 것을 창조하기 위해 학습을 한 것”이라고 밝혔다.
'프로젝트 파나마'가 공개된 후 앤트로픽에 대한 비판이 이어진다. IT 매체 퓨처리즘은 지난달 31일 보도에서 “'프로젝트 파나마'에 윤리적 문제가 있다고 생각된다면, 당신만 그렇게 느끼는 게 아니다. 앤트로픽도 '프로젝트 파나마'가 알려질 경우 심각한 문제가 될 수 있다는 걸 알고 있었다”며 “이번 사건이 기술이 예술을 파괴하는 상징처럼 보일 것이라고 앤트로픽도 인식한 것”이라고 밝혔다.
영국출판협회는 지난달 29일 영국의 도서 전문매체 더북셀러 인터뷰에서 “'프로젝트 파나마'는 비난받아 마땅하다. 이를 비밀로 유지하려 했다는 사실 자체가 법적·윤리적 문제점을 인지하고 있었음을 시사한다”며 “미국 지방법원의 판결은 이의 제기를 받을 것이다. 상식에 입각한 판결이 우선된다면, 지난해 판결은 뒤집힐 가능성이 높다”고 지적했다. 영국작가협회 역시 “지금 당장 생성형 AI의 파괴적인 정책을 규제해야 한다”고 밝혔다.
앤트로픽은 중고책뿐 아니라 온라인에 유포된 불법 저작물까지 AI 학습에 활용했다. 앤트로픽 공동 창립자 벤 만은 앤트로픽 설립 5개월 뒤인 2021년 6월 저작권 침해 콘텐츠가 모여 있는 사이트 '리브젠'에서 소설 등 콘텐츠를 대량 다운로드했으며, 2022년 7월 불법 콘텐츠 사이트 '해적 도서관 미러'라는 사이트를 발견하고 직원들에게 “딱 맞춰 나왔다”며 링크를 전송했다. 작가들은 지난해 앤트로픽이 불법 콘텐츠를 AI 학습에 활용했다며 소송을 제기했으나 지난해 8월 앤트로픽이 작가들에게 15억 달러(한화 약 2조1810억 원) 합의금을 지급하면서 소송이 종결됐다.
Copyright © 미디어오늘. 무단전재 및 재배포 금지.
- 청와대 “위안부 역사 부정하는 책 공공도서관 비치 우려” - 미디어오늘
- 尹 “22시 KBS 준비됐다” 진실은…노조, 박장범 ‘내란선동’ 혐의 고발 - 미디어오늘
- 청와대 ‘日수산물 수입 재개 논의’ 했다는데 김민석 “논의된 바 없어” - 미디어오늘
- ‘고액자산가 탈한국 자료 잘못’ 사과한 대한상의, 오히려 감싸는 국힘 - 미디어오늘
- [속보] 김상민 매관매직 무죄 논란 “이우환 그림 김건희 전달 증명실패” - 미디어오늘
- “부자 2400명 한국 떠났다” 받아쓴 언론, 너도나도 기사 삭제 - 미디어오늘
- 뉴스타파 박중석 대표 1년, 노조원 79% 소통 방식 부정 평가 - 미디어오늘
- ‘성폭력’ 안희정 등장에 “감동을 보탰다”고 보도한 언론사는? - 미디어오늘
- [영상] 황명선, 이성윤 잡더니 유감표명 방식에 폭발 “우리가 전준철 대변인 아니잖아요” - 미
- 아침마다 사과 요구 받는 정청래…특검 논란에 “대통령 누 끼쳐 죄송” - 미디어오늘