"AI 모델 중 GPT-4 저작권 보호가 최악"

박종화 2024. 3. 7. 09:21
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

주요 인공지능(AI) 모델 중 오픈AI의 'GPT-4'의 저작권 보호가 가장 허술한 것으로 나타났다.

6일(현지시간) CNBC 등에 따르면 AI 모델 평가회사인 패트로너스 AI는 이날 발표한 보고서에서 주요 AI 모델 4개(오픈AI 'GPT-4'·앤스로픽 '클로드 2'·메타 '라마2'·미스트랄 AI '믹스트랄') 가운데 GPT-4가 저작권 침해 소지가 있는 콘텐츠를 가장 많이 생성했다고 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AI 모델 평가회사 패트로너스 AI 분석
오픈AI "저작권 자료 없이 AI 학습 불가능"

[이데일리 박종화 기자] 주요 인공지능(AI) 모델 중 오픈AI의 ‘GPT-4’의 저작권 보호가 가장 허술한 것으로 나타났다.

(사진=로이터·연합뉴스)

6일(현지시간) CNBC 등에 따르면 AI 모델 평가회사인 패트로너스 AI는 이날 발표한 보고서에서 주요 AI 모델 4개(오픈AI ‘GPT-4’·앤스로픽 ‘클로드 2’·메타 ‘라마2’·미스트랄 AI ‘믹스트랄’) 가운데 GPT-4가 저작권 침해 소지가 있는 콘텐츠를 가장 많이 생성했다고 밝혔다.

패트로너스 AI는 길리언 플린의 ‘사라진 그녀’나 미셸 오바마의 ‘비커밍’ 등 저작권이 있는 인기 도서의 첫 구절을 알려 달라거나 특정 구절을 이어서 완성해 달라는 프롬프트(명령어)를 통해 AI 모델이 얼마나 저작권을 잘 보호하는지 평가했다. 그 결과 GPT-4는 패트로너스 AI가 입력한 프롬프트의 44%에 대해 저작권 침해 소지가 있는 콘텐츠를 생성했다. 믹스트랄(22%)과 라마 2(10%), 클로드 2(8%) 등이 그 뒤를 이었다.

레베카 치앙 패트로너스 AI 최고기술책임자(CTO)는 “우리는 그것이 오픈소스든 비공개소스든 상관없이 우리가 평가한 AI 모델에서 저작권 있는 콘텐츠를 많이 발견할 수 있었다”고 했다. 오픈AI 등 AI 모델 제작사들은 패트로너스 AI 평가에 대해 입장을 내놓지 않았다.

최근 생성형 AI가 급성장하면서 AI 학습 데이터를 두고 저작권 분쟁도 확산하고 있다. 지난해엔 베스트셀러 작가 존 그리샴과 드라마 ‘왕좌의 게임’ 원작자 조지 R.R. 마틴, 뉴욕타임스(NYT) 등이 오픈AI가 AI를 학습하는 데 자신들의 창작물을 무단으로 사용했다며 잇따라 손해배상 소송을 제기했다.

오픈AI는 올 1월 영국 상원에 제출한 답변서에서 “오늘날 저작권은 블로그·포럼 게시물, 사진, 소프트웨어 코드, 정부 문서 등 사실상 인류의 모든 표현물에 적용되기 때문에 저작권 있는 자료를 사용하지 않고는 첨단 AI 모델을 학습시키는 건 불가능하다”고 했다. 오픈AI는 NYT 소송엔 NYT가 챗GPT를 해킹해 고의로 저작권 침해 사례를 만들었다고도 주장했다.

박종화 (bell@edaily.co.kr)

Copyright © 이데일리. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?