“네이버 등 AI 학습 때 데이터 쓰면 비용 내야”···첫 ‘AI 저작권 가이드라인’
네이버 같은 인공지능(AI) 사업자가 ‘생성형 AI 학습’ 등을 위한 데이터를 쓰려면 저작권자에게 적절한 보상 등을 해야 한다는 정부의 가이드라인이 처음으로 나왔다. 또 인간이 창작하지 않은 채 AI가 만든 것은 저작권을 인정하지 않기로 했다.
문화체육관광부는 27일 저작권 정책 비전과 과제를 담은 ‘저작권 강국 실현, 4대 전략’ 발표를 통해 이런 내용이 담긴 ‘생성형 AI 저작권 안내서’를 공개했다. 학습 자료를 공개하도록 AI법을 만든 유럽연합(EU) 이후 정부 차원에서 AI 저작권 가이드라인을 만든 국가는 한국이 처음이다.
챗GPT 같은 생성형 AI에 기초가 되는 거대언어모델(LLM)을 만드는 데는 수백억~수천억 개의 매개변수(파라미터)가 필요하다. 이런 방대한 데이터를 모아서 AI를 학습시키는 과정에 텍스트, 이미지, 영상 등의 저작물이 무단으로, 광범위하게 쓰일 수 있어서 가이드라인을 마련키로 한 것이다.
이번 가이드라인은 저작권 분쟁을 사전에 막기 위해 AI 사업자는 적법한 이용 권한을 확보해야 한다고 명시했다. 문체부는 “홈페이지와 블로그 등을 통해 공개된 저작물이라는 사실만으로 해당 저작물을 저작권자 허락 없이 이용할 수 있는 것은 아닌 만큼 저작물 이용 시 유의해야 한다”고 밝혔다.
또 사업자가 학습용으로 복제한 데이터를 계속 보관하거나 다른 목적으로 이용할 경우 저작권자의 이익을 부당하게 해할 우려가 있어 계약을 통해 이용 목적·범위, 기간 등도 명시토록 했다.
애플과 오픈AI, 구글 등 AI를 개발하는 빅테크 기업들은 최근 언론사들과 미디어 콘텐츠 확보를 위해 계약을 맺었거나 추진하고 있다. 저작권 관련 법적 분쟁을 피하고 검증된 고품질의 생성형 AI를 구축하기 위해서다. 애플은 AI에 뉴스 콘텐츠를 활용하기 위해 언론·출판사들과 5000만 달러(약 651억원) 규모의 다년 계약을 논의한 것으로 알려졌다.
문체부 관계자는 “미국 등 각국 현황을 보면 기업들이 저작권 보호를 위해 자율적으로 움직이고 있는 추세”라며 “이번 가이드라인은 AI 저작권을 둘러싼 불확실성을 해소해 사업을 하는 데 도움이 될 것”이라고 말했다.
가이드라인에 따르면, 저작권자도 스스로 권리를 지켜야 한다. 자신의 저작물이 AI 학습에 이용되는 것을 원하지 않는다면 반대 의사를 적절한 방식으로 명시하거나, 이를 방지하기 위한 기술적인 조치를 취해야 한다.
이용자는 AI 산출물을 만들기 위해 입력하는 데이터가 타인의 저작권을 침해하거나 침해를 유도하지 않도록 유의해야 한다.
또한 가이드라인은 ‘인간의 창작적 개입이 없는 AI 산출물에 대한 저작권은 등록이 불가능하다’고 명시했다. 인간과 AI가 함께 작업한 창작물도 인간 행위에 의한 결과임이 명백한 부분에 대해서만 제한적으로 저작권을 인정할 방침이다.
문체부는 “AI 창작물에 대한 저작권 규정을 법제화하는 것은 시기상조”라며 “해외 판례 등을 참고해 의견 수렴을 거쳐 논의할 계획”이라고 말했다. 최근 영국과 미국 등의 법원은 인간의 적절한 개입 없이는 AI에게 저작권을 부여할 수 없다는 취지의 최종 판결이 잇따라 나왔다.
문체부는 향후 업계 의견 수렴을 통해 적법한 보상 시스템과 이용 권한 확보, 창작물 인정 여부에 대한 기준 등을 계속 논의할 예정이다. 이번 가이드라인에 따라 향후 저작권 보상 방안을 구체화하는 과정에 국내에서도 AI 기업과 언론매체 등과의 갈등이 일어날 소지도 있다.
이에 AI업계는 현실에 맞지 않는다며 당장 반발하고 나섰다.
한국소프트웨어산업협회(KOSA) 산하의 초거대AI추진협의회는 “학습 데이터에 대해 적법한 권한을 확보할 것을 권고한다”는 문구를 삭제해야 한다는 내용의 건의서를 문체부에 제출했다. 이들은 “권고에 따르면 방대한 데이터의 이용 목적과 기간, 대가 등을 건건이 협의·계약해야 한다는 의미로 풀이될 수 있어 글로벌 경쟁에 뒤처질 수 있다”고 주장했다.
업계 관계자는 “해외 빅테크 기업들이 한국어를 비롯한 모든 공개 데이터를 학습 후 선두기업으로 올라선 후 규제를 만들어 후발주자를 막고 있어 대등한 경쟁이 힘들어 지고 있다”며 “플랫폼공정경쟁촉진법에 이어 이번 가이드라인이 AI 발전에 또 다른 족쇄가 될 수 있다”고 말했다.
최경진 한국인공지능법학회장(가천대 법학과 교수)는 “저작권이 명확한 정제된 정보 외에 성격이 불분명한 공개된 정보를 어떻게 쓸 것인가가 향후 핵심 논점이 될 것”이라며 “혁신과 저작권 보호 사이에 균형을 찾을 수 있도록 구체적인 논의를 시작해야 한다”고 말했다.
김은성 기자 kes@kyunghyang.com
Copyright © 경향신문. 무단전재 및 재배포 금지.
- [단독] 강혜경 “명태균, 허경영 지지율 올려 이재명 공격 계획”
- “아들이 이제 비자 받아 잘 살아보려 했는데 하루아침에 죽었다”
- 최현욱, 키덜트 소품 자랑하다 ‘전라노출’···빛삭했으나 확산
- 수능문제 속 링크 들어가니 “김건희·윤석열 국정농단 규탄” 메시지가?
- 윤 대통령 ‘외교용 골프’ 해명에 김병주 “8월 이후 7번 갔다”···경호처 “언론 보고 알아
- 이준석 “대통령이 특정 시장 공천해달라, 서울 어떤 구청장 경쟁력 없다 말해”
- “집주인인데 문 좀···” 원룸 침입해 성폭행 시도한 20대 구속
- 뉴진스 “민희진 미복귀 시 전속계약 해지”…어도어 “내용증명 수령, 지혜롭게 해결 최선”
- 이재명 “희생제물 된 아내···미안하다, 사랑한다”
- ‘거제 교제폭력 사망’ 가해자 징역 12년…유족 “감옥 갔다 와도 30대, 우리 딸은 세상에 없어