소송당하는 ‘생성형 AI’...잘나가는 챗GPT 저작권에 발목?
미국 워싱턴포스트(WP) 등의 보도에 따르면, 캘리포니아 소재 로펌 클락슨은 지난 6월 28일(현지 시간) 오픈AI가 인터넷에서 모은 정보로 AI를 훈련하는 과정에서 저작권과 인터넷 이용자의 프라이버시를 침해했다며 캘리포니아 북부 연방법원에 집단 소송을 제기했다.
157페이지에 달하는 소장에서 클락슨은 오픈AI가 인터넷에서 방대한 양의 개인 데이터를 ‘몰래 수집했다’고 밝혔다. 그러면서 “개인정보를 포함한 책, 기사, 웹사이트와 게시물 등 인터넷에서 교환할 수 있는 데이터들이 사전 통지나 동의와 같이 정당한 보상 없이 이용됐다”고 주장했다. 게다가 이런 데이터 수집이 ‘전례 없는 규모’로 이뤄졌다며 수백만 명에 달할 것으로 추정되는 피해자가 받을 잠재적 손해가 30억달러(3조9500억원)에 달한다고 강조했다.
클락슨은 과거 데이터 침해에서 허위 광고에 이르기까지 대규모 집단 소송을 제기한 바 있다. 이 로펌은 “인터넷에 올라와 있는 수많은 글을 쓴 이들은 오픈AI가 자사 이익을 위해 이런 정보를 사용하는 것에 동의하지 않았다”고 밝혔다. 클락슨은 인터넷 데이터에 기반을 둔 오픈AI 제품의 상업적 사용을 일시적으로 동결하는 형태의 금지명령을 요청했다. 아울러 정보를 제공한 사람들에게 ‘데이터 배당금’ 지급도 요구했다.
클락슨의 변호사 라이언 클락슨은 WP에 “챗GPT가 활용한 정보는 대규모 언어 모델에 의해 사용될 의도가 전혀 없었는데도 수집됐다”며 “AI 알고리즘이 훈련되고 데이터가 사용될 때 사람들이 어떻게 보상받을 수 있는지에 대해 법원 판단을 받아볼 필요가 있다”고 이번 집단 소송 취지를 설명했다.
생성형 AI에 대한 집단 소송 증가
게티이미지는 AI 스타트업 고소
생성형 AI는 콘텐츠 제작에 드는 시간을 줄이고 생산성을 높이는 도구로 기대감이 크다. 그러나 기존 데이터를 학습하고 이를 기반으로 콘텐츠를 생산하다 보니 저작권 침해 문제 해결이 필수다.
미국에서는 이번 소송이 생성형 AI가 사회관계망서비스(SNS)의 댓글, 블로그 게시물 등을 사용하며 인터넷 이용자의 권리를 침해했는지를 판단하는 새로운 법적 이론을 정립하는 계기가 될 것으로 기대한다.
생성형 AI 열풍 이후 공공 인터넷에서 가져온 데이터를 이용해 AI를 훈련하는 행위에 대한 합법성 논란이 심했다. 오픈AI뿐 아니라 구글, 아마존 등 생성형 AI를 개발 중인 기업들이 대가를 지불하지 않고 수집한 정보를 통해 막대한 상업적 이익을 거두고 있어서다. 현재 인터넷에서 가져온 데이터를 사용해 개발자에게 큰 수익을 안겨줄 수 있는 도구를 훈련시키는 게 합법인지는 불투명한 상황이다.
이에 따라 생성형 AI 개발 기업에 대한 법적 조치를 요구하는 소송도 점점 늘어나는 추세다. 지난 11월 오픈AI와 마이크로소프트(MS)가 MS 소유의 온라인 코딩 플랫폼인 깃허브에 저장된 컴퓨터 코드를 사용해 AI 도구를 학습시킨 것에 대해 집단 소송이 제기됐다. 2월에는 이미지 판매 사이트인 게티이미지가 이미지 생성 봇을 훈련하는 과정에서 자사 사진을 무단으로 사용했다며 소규모 AI 스타트업인 스태빌리티AI를 고소하기도 했다.
다만, 자신의 저작물이 AI 학습에 사용됐다는 사실을 입증할 수 있는 예술가나 기타 전문가들과 달리, 단순히 웹사이트에 게시물을 올리거나 댓글을 단 사람들이 손해배상을 받을 가능성은 크지 않다는 견해가 주류다. SNS나 웹사이트에 콘텐츠를 올리는 행위가 일반적으로 콘텐츠를 사용할 수 있도록 매우 광범위한 라이선스(허가)까지 동시에 부여한다는 뜻으로 받아들여질 수 있어서다.
‘공정 사용’ 원칙 적용? 구글 사례 주목
상업성 있어도 ‘문화 발전’ 기여하면 OK
또한 미국 캘리포니아 연방법원이 미 로펌 클락슨의 소송을 받아들일지도 미지수다. 이미 일부 AI 개발자를 중심으로 “인터넷상 정보를 사용하는 건 기존 저작권이나 개인정보를 침해하는 ‘무단 수집’이 아니다”라는 반론이 나와서다. WP 등 주요 외신에서도 ‘공정 사용(Fair Use)’ 원칙을 언급하며, 법원이 오픈AI 손을 들어줄 수 있다는 평가가 나온다. 공정 사용 원칙은 저작권이 있는 저작물도 ‘조건’만 맞으면 타인이 사용할 수 있도록 허용하는 규정이다.
공정 사용 원칙은 1976년부터 미 개정저작권법에 성문화됐다. 내용을 살펴보면, 공정 사용을 판단하는 명백한 기준이 명시돼 있다. 특정 조건에 부합할 경우 저작권 침해 행위를 면책하는 방식이다.
미 저작권법 제107조는 공정 사용 여부를 판단할 때 ① 이용의 목적과 성격(The purpose and character of the use) ② 저작물의 성격(The nature of the copyrighted works) ③ 이용된 부분이 저작물 전체에서 차지하는 비중과 중요성(The amount and sustantiality of the portion used in relation to the copyrighted work as a whole) ④ 저작물이 관련 시장에 미치는 영향(The effect of the use upon the potential market for or value of the copyrighted work) 등 4개 요소를 따져본다. 이 중 2개 요소에만 부합해도 공정 사용으로 본다.
미 법원은 특히 ①번 요소를 중요하게 판단한다. ①번 요소를 가르는 기준은 ‘상업성’이다. 상업적 목적을 갖고 다른 저작권을 수집, 사용한 경우 ①에 부합하지 않는다고 평가하는 경우가 대다수다. 다만 상업적 목적을 갖고 있더라도 사회 전체 이익을 증대시킨다면 공정 사용으로 보기도 한다. 저작권의 존재 이유인 ‘문화 산업 발전’에 기여한다는 취지다. 기존 저작물을 상업적으로 재사용하고, 기존 시장을 침범해도 문화 산업에 도움을 준다면 공정 사용이라고 평가한다는 게 전문가들 설명이다.
이번 소송에서 오픈AI를 지지하는 AI업계 관계자 주장도 이와 맞닿아 있다. 생성형 AI가 인터넷상 정보를 활용, 상업적으로 사용하는 측면도 있지만 문화 산업 발전에 기여하는 측면도 상당하다는 주장이다. 이미 웹툰, 미술, 음악 등 다양한 분야에서 생성형 AI가 쓰이고 있다는 점을 고려한 설명이다. 하버드 경영대학원이 발간하는 ‘하버드 비즈니스 리뷰(HBR)’는 생성형 AI의 발전이 더 많은 사람들이 창의성을 발휘할 수 있게 돕고 있다고 강조한다. HBR은 지난 4월 리포트를 통해 “AI는 인간이 이미 수행하는 단순 작업을 지원할 뿐, 창의력이 요구되는 분야에선 위협이 되지 않고 있다”며 “오히려 단순 업무에 대한 진입장벽이 낮아진 만큼, 과거보다 더 많은 이들이 창의성을 발휘할 수 있는 환경이 조성되고 있다”고 말했다.
“사전 동의·정당한 보상 없어”
잠재적 손해 30억달러 주장도
회색지대서 사법 판단에 주목
2013년, 데니 친 미 연방법원 판사는 “구글이 사용자에게 도서 검색 결과나 미리 보기를 제공하는 것은 저작권법상 ‘공정한 이용’에 해당한다”고 판결했다. 이후 미 대법원도 미 연방법원의 판결을 따랐다. 2016년 미 대법원은 별도 논평 없이 미국 작가협회의 항고 심리를 기각했다. 구글 서비스가 문화 산업 발전에 기여할 것이라고 판단한 셈이다. 당시 구글은 미 대법원 판결 직후 “디지털 시대에 사람들이 책을 찾고 사는 새로운 방법을 제시하는 카탈로그 같은 역할을 할 것”이라고 강조했다.
국내 AI 저작권 관련 상황은
소송 사례 없지만, 갈등 본격화 전망
국내에서는 아직 AI 저작권을 두고 소송이 벌어진 사례는 없다. 다만 AI 시장이 빠르게 커지는 만큼 향후 갈등이 본격화될 가능성이 높다. 특히 최근 생성형 AI 개발 기업들이 늘면서 오픈AI처럼 인터넷상 정보를 허락 없이 ‘데이터 쌓기’에 활용하는 경우가 생기고 있다. AI업계 일각에서 “AI 저작권 갈등은 곧 불거질 이슈”라고 단정하는 이유다.
지난 3월 네이버 사례가 대표적이다. 네이버는 올해 3월 콘텐츠 제휴를 맺은 언론사에 ‘뉴스 콘텐츠 제휴 약관 개정안’을 전달했다. 이 중 논란이 된 건 제8조 3항이다. 네이버는 해당 조항에서 “서비스 개선, 새로운 서비스 개발을 위한 연구를 위해 직접 혹은 공동, 제3자에게 위탁하는 방식으로 정보를 이용할 수 있다. 단 네이버 계열사가 아닌 제3자에게 위탁하는 방식으로 진행할 경우 사전에 제공자 동의를 얻어야 한다”고 밝혔다.
그간 네이버와 네이버 계열사는 서비스 연구개발 목적으로 뉴스 콘텐츠를 활용하려면 사전에 언론사 동의를 얻어야 했다. 하지만 앞으로는 동의 없이 이용할 수 있다는 내용을 담은 셈이다. IT업계는 네이버의 자사 챗봇 서비스, 초거대 언어 모델 구축 시 뉴스 콘텐츠가 필요하다고 설명한다. AI 학습을 위해서는 다량의 정보가 필요한데, 뉴스 콘텐츠가 가장 적합하다는 것이다. 네이버는 자회사 네이버클라우드와 네이버랩스 등을 통해 자사 초거대 언어 모델 ‘하이퍼클로바’를 고도화, 오는 8월 ‘하이퍼클로바X’를 출시할 예정이다. 검색 기반 AI 서비스 ‘큐:(Cue:)’도 개발에 속도가 붙고 있다.
이에 한국신문방송편집인협회·한국기자협회·한국여성기자협회·한국인터넷신문협회 등 언론 단체들은 성명을 내고, 네이버의 일방적인 뉴스 콘텐츠 제휴 약관 변경과 언론사의 지식재산권·자율권·편집권 침해 행위를 중단하라고 촉구했다. 결국 네이버는 지난 4월 약관을 수정, 뉴스 콘텐츠 활용 시 언론사 동의를 받는 방식으로 변경했다.
갈등 사례가 등장하며 AI 개발 과정에서 발생할 수 있는 저작권·개인정보 침해 문제와 관련한 규제가 필요하다는 주장이 나온다. 정부도 움직인다. 문화체육관광부와 한국저작권위원회는 지난 2월 ‘AI-저작권법 제도 개선 워킹그룹’을 발족하고 관련 가이드라인을 준비 중이다. 다만 생성형 AI 관련 저작권 침해 여부를 두고 판결이 난 것도 없고, 해외 사례도 부족해 가이드라인 확보까지는 시간이 필요할 것으로 보인다.
[본 기사는 매경이코노미 제2217호 (2023.07.12~2023.07.18일자) 기사입니다]
Copyright © 매경이코노미. 무단전재 및 재배포 금지.
- 尹 대통령 지원 발언에...우크라 재건 관련주 ‘들썩’ [오늘, 이 종목] - 매일경제
- K뷰티도 럭셔리가 되네? ... ‘디어달리아’ 샤넬, 디올과 어깨 나란히[내일은 유니콘] - 매일경제
- 청약 나서는 센서뷰·와이랩...수요예측 흥행 이어갈까 [IPO 따상 감별사] - 매일경제
- 美 장갑차 프로젝트 하차한 한화...호주 ‘레드백’으로 만회할까 - 매일경제
- 완성차 판매 ‘훨훨’ 날아가니 부품株도 ‘씽씽’ - 매일경제
- “이 와중에 10억 올랐다고?”...은평뉴타운 집값 자고 나면 ‘쑥쑥’ [김경민의 부동산NOW] - 매일
- “급한 불 끈다” 1년간 집주인 DSR 70% 넘어도 ‘전세금 반환대출’ - 매일경제
- ‘페이커’ 내세운 삼성 OLED 게이밍 모니터 글로벌 3천대 돌파 - 매일경제
- “6억짜리가 3억으로”...전세 ‘반 토막’에 송도 집주인 ‘곡소리’ [김경민의 부동산NOW] - 매
- 메타 ‘스레드’ 훈풍에...협력사 주가 연일 상한가 [오늘, 이 종목] - 매일경제