GPT-4, 주요 AI 모델 중 저작권 보호 '최악'
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
주요 인공지능(AI) 모델 가운데 오픈AI 'GPT-4'가 저작권 보호에 가장 취약한 것으로 나타났다.
AI 모델 평가 스타트업 패트로너스AI는 6일(현지시간) GPT-4·클로드 2(앤스로픽)·라마 2(메타)·믹스트랄(미스트랄 AI) 등 주요 4개 거대언어모델(LLM)의 저작권 침해 정도에 관한 연구 결과를 발표했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
주요 인공지능(AI) 모델 가운데 오픈AI 'GPT-4'가 저작권 보호에 가장 취약한 것으로 나타났다.
AI 모델 평가 스타트업 패트로너스AI는 6일(현지시간) GPT-4·클로드 2(앤스로픽)·라마 2(메타)·믹스트랄(미스트랄 AI) 등 주요 4개 거대언어모델(LLM)의 저작권 침해 정도에 관한 연구 결과를 발표했다.
패트로너스AI는 길리언 플린의 '사라진 그녀', 미셸 오바마의 '비커밍' 등 인기가 높은 저작권 보호 저서를 대상으로 책의 첫 구절이나 텍스트를 완성해 달라는 100가지 프롬프트를 입력해 AI 모델의 저작권 보호 수준을 평가했다.
그 결과 GPT-4는 평균 44%의 저작권 보호를 받는 콘텐츠를 생성했다. 이어 믹스트랄(22%)과 라마 2(10%), 클로드 2(8%) 순이었다.
클로드 2의 경우 책의 텍스트 완성을 거부하는 등 저작권이 있는 콘텐츠를 피하면서 저작권 침해에 대해 높은 수준의 주의를 보였다고 패트로너스AI는 설명했다.
레베카 첸 패트로너스AI 최고기술책임자(CTO)는 “오픈소스 여부와 상관없이 우리가 평가한 AI 모델에서 저작권 있는 콘텐츠를 많이 발견할 수 있었다”며 “놀라운 것은 가장 많이 이용되는 GPT-4에서 비율이 가장 높다는 사실”이라고 지적했다.
이번 연구 결과는 최근 거대언어모델(LLM)의 저작권 침해와 관련한 소송이 잇따르고 있는 가운데 나와 이목을 끈다.
드라마 '왕좌의 게임' 원작자인 조지 R.R. 마틴과 존 그리샴 등 베스트셀러 작가, 뉴욕타임스(NYT) 등은 오픈AI가 GPT 언어모델을 훈련하는 과정에서 자신들의 창작물을 무단 사용했다며 잇따라 소송을 제기했다.
오픈AI는 올 1월 영국 상원에 제출한 답변서에서 “오늘날 저작권은 블로그·포럼 게시물, 사진, 소프트웨어 코드, 정부 문서 등 거의 모든 종류의 인류 표현물에 적용되기 때문에 저작권 있는 자료를 사용하지 않고는 AI 모델을 학습시키는 건 불가능하다”고 밝혔다.
조재학 기자 2jh@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.
- 과기 인력, 5년간 4만7천명 부족 '빨간불'
- 공정위원장, 플랫폼법 연내 제정…'사전지정제'는 韓·美 반대에 대체
- EU, 디지털시장법 전면 시행…美 플랫폼 '빅5' 게이트키퍼 지정
- SK하이닉스 찾은 이재명… “과감한 규제개혁과 세제 지원 하겠다”
- 최상목, 시중은행장 간담회…“외환시장 구조개선 역할 당부”
- 한동훈, '경기도 정치 1번지' 수원 세번째 방문…탈환 총력
- 대통령실, '민생토론 925조 퍼주기' 野 주장은 사실 왜곡
- “어르신도 가능한 단기알바 하실래요?”…혹하게 꿰어내는 스미싱 기승
- 오영주 장관 “무역협회, 중소벤처기업 글로벌화 협력해달라
- [신차드라이브]대체불가 존재감 '벤츠 CLE 쿠페'