"압도적 성능 GPT-4, 4개 AI 모델 중 저작권 보호 가장 취약"
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
오픈 AI 최신 LLM(거대언어모델)인 GPT-4가 주요 AI(인공지능) 모델 중 저작권 침해가 가장 심하다는 연구 결과가 나왔다.
AI 모델 평가 업체 패트로너스 AI는 6일(현지시간) GPT-4, 엔트로피의 클로드 2, 메타의 라마 2, 미스트랄 AI의 믹스트랄 등 주요 4개 모델의 저작권 침해 정도를 연구했다고 밝혔다.
패트로너스 AI는 "클로드 2는 책의 텍스트를 완성하는 걸 거부하는 등 저작권 침해에 대한 높은 수준의 주의를 보였다"고 설명했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
오픈 AI 최신 LLM(거대언어모델)인 GPT-4가 주요 AI(인공지능) 모델 중 저작권 침해가 가장 심하다는 연구 결과가 나왔다.
AI 모델 평가 업체 패트로너스 AI는 6일(현지시간) GPT-4, 엔트로피의 클로드 2, 메타의 라마 2, 미스트랄 AI의 믹스트랄 등 주요 4개 모델의 저작권 침해 정도를 연구했다고 밝혔다. 이 업체는 길리언 플린의 '사라진 그녀', 미셸 오바마의 '비커밍' 등 인기 있는 책의 첫 구절이나 텍스트를 완성해달라는 100가지 프롬프트를 입력하며 모델 반응을 평가했다.
그 결과 GPT-4가 평균 44%의 저작권 보호를 받는 콘텐츠를 생산했으며 믹스트랄 22%, 라마 10%, 클로드 2 8% 순으로 나타났다.
패트로너스 AI는 "클로드 2는 책의 텍스트를 완성하는 걸 거부하는 등 저작권 침해에 대한 높은 수준의 주의를 보였다"고 설명했다.
공동창업자인 레베카 첸 CTO(최고기술책임자)는 "평가 대상이 된 모든 모델에서 저작권이 있는 콘텐츠를 발견했다"며 "놀라운 것은 가장 많이 이용되는 GPT-4에서 가장 높은 비율이 나타났다"고 지적했다.
이번 연구 결과는 AI 모델들의 저작권 침해 소송이 잇따르는 가운데 나왔다는 점에서 의미가 있다.
작년 9월 인기 드라마 '왕좌의 게임' 원작자인 조지 R.R 마틴과 존 그리샴 등 베스트셀러 작가들이 MS(마이크로소프트)와 오픈AI가 모델 을 학습하는 과정에서 자신들의 창작물을 무단으로 사용했다며 집단으로 소송을 제기한 바 있다. 뉴욕타임스도 작년 12월 수백만 건의 기사가 훈련하는데 활용됐다고 소송을 제기했다.
패트로너스 AI는 "이번 연구 결과는 AI 개발자들이 저작권이 있는 자료의 무단 사용을 방지하는 메커니즘 개발을 우선시해야 할 필요성을 시사한다"면서 기업들이 LLM을 사용할 수 있도록 지원하는 저작권 침해 탐지 AI 도구 '카피라이트캐처'를 출시했다. 이 AI 도구는 기업이 LLM을 사용할 수 있도록 지원하는 플랫폼이다.김영욱기자 wook95@dt.co.kr
Copyright © 디지털타임스. 무단전재 및 재배포 금지.
- 아내 출산하러 집 비웠는데…아내 후배 데려와 성폭행
- "나라에 망조"…`김학의 불법출금 의혹` 이규원 검사 사직
- 뉴욕 버젓이 활보한 욱일기 인력거, 항의하자 돌아온 `황당 답변`
- 현직 경찰, 술 취해 여경 폭행…현행범 체포돼
- 나발니 생전 인터뷰…"내가 죽어도 준비된 다른 사람들 있다"
- KDI "중장기 민간소비 증가율 1%대 중반"
- 현대차그룹, 폭스바겐 누르고 수익성 톱2 등극
- 믿을 건 밸류업뿐인데…세제 인센티브, 국회 통과 `하세월`
- 코스피 하락 베팅 `곱버스` 거래량↑…"트럼프 리스크 주의해야"
- 성수·영등포 확 바뀌나… 서울 준공업지역 규제 확 푼다