“네이버 등 AI 학습 때 데이터 쓰면 비용 내야”···첫 ‘AI 저작권 가이드라인’

김은성 기자 2023. 12. 27. 17:31
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

유인촌 문화체육관광부 장관이 27일 서울 서대문구 모두예술극장에서 열린 ‘저작권 강국 실현 4대 전략’ 브리핑에서 인사말을 하고 있다. 연합뉴스

네이버 같은 인공지능(AI) 사업자가 ‘생성형 AI 학습’ 등을 위한 데이터를 쓰려면 저작권자에게 적절한 보상 등을 해야 한다는 정부의 가이드라인이 처음으로 나왔다. 또 인간이 창작하지 않은 채 AI가 만든 것은 저작권을 인정하지 않기로 했다.

문화체육관광부는 27일 저작권 정책 비전과 과제를 담은 ‘저작권 강국 실현, 4대 전략’ 발표를 통해 이런 내용이 담긴 ‘생성형 AI 저작권 안내서’를 공개했다. 학습 자료를 공개하도록 AI법을 만든 유럽연합(EU) 이후 정부 차원에서 AI 저작권 가이드라인을 만든 국가는 한국이 처음이다.

챗GPT 같은 생성형 AI에 기초가 되는 거대언어모델(LLM)을 만드는 데는 수백억~수천억 개의 매개변수(파라미터)가 필요하다. 이런 방대한 데이터를 모아서 AI를 학습시키는 과정에 텍스트, 이미지, 영상 등의 저작물이 무단으로, 광범위하게 쓰일 수 있어서 가이드라인을 마련키로 한 것이다.

이번 가이드라인은 저작권 분쟁을 사전에 막기 위해 AI 사업자는 적법한 이용 권한을 확보해야 한다고 명시했다. 문체부는 “홈페이지와 블로그 등을 통해 공개된 저작물이라는 사실만으로 해당 저작물을 저작권자 허락 없이 이용할 수 있는 것은 아닌 만큼 저작물 이용 시 유의해야 한다”고 밝혔다.

또 사업자가 학습용으로 복제한 데이터를 계속 보관하거나 다른 목적으로 이용할 경우 저작권자의 이익을 부당하게 해할 우려가 있어 계약을 통해 이용 목적·범위, 기간 등도 명시토록 했다.

애플과 오픈AI, 구글 등 AI를 개발하는 빅테크 기업들은 최근 언론사들과 미디어 콘텐츠 확보를 위해 계약을 맺었거나 추진하고 있다. 저작권 관련 법적 분쟁을 피하고 검증된 고품질의 생성형 AI를 구축하기 위해서다. 애플은 AI에 뉴스 콘텐츠를 활용하기 위해 언론·출판사들과 5000만 달러(약 651억원) 규모의 다년 계약을 논의한 것으로 알려졌다.

문체부 관계자는 “미국 등 각국 현황을 보면 기업들이 저작권 보호를 위해 자율적으로 움직이고 있는 추세”라며 “이번 가이드라인은 AI 저작권을 둘러싼 불확실성을 해소해 사업을 하는 데 도움이 될 것”이라고 말했다.

가이드라인에 따르면, 저작권자도 스스로 권리를 지켜야 한다. 자신의 저작물이 AI 학습에 이용되는 것을 원하지 않는다면 반대 의사를 적절한 방식으로 명시하거나, 이를 방지하기 위한 기술적인 조치를 취해야 한다.

이용자는 AI 산출물을 만들기 위해 입력하는 데이터가 타인의 저작권을 침해하거나 침해를 유도하지 않도록 유의해야 한다.

또한 가이드라인은 ‘인간의 창작적 개입이 없는 AI 산출물에 대한 저작권은 등록이 불가능하다’고 명시했다. 인간과 AI가 함께 작업한 창작물도 인간 행위에 의한 결과임이 명백한 부분에 대해서만 제한적으로 저작권을 인정할 방침이다.

문체부는 “AI 창작물에 대한 저작권 규정을 법제화하는 것은 시기상조”라며 “해외 판례 등을 참고해 의견 수렴을 거쳐 논의할 계획”이라고 말했다. 최근 영국과 미국 등의 법원은 인간의 적절한 개입 없이는 AI에게 저작권을 부여할 수 없다는 취지의 최종 판결이 잇따라 나왔다.

문체부는 향후 업계 의견 수렴을 통해 적법한 보상 시스템과 이용 권한 확보, 창작물 인정 여부에 대한 기준 등을 계속 논의할 예정이다. 이번 가이드라인에 따라 향후 저작권 보상 방안을 구체화하는 과정에 국내에서도 AI 기업과 언론매체 등과의 갈등이 일어날 소지도 있다.

이에 AI업계는 현실에 맞지 않는다며 당장 반발하고 나섰다.

한국소프트웨어산업협회(KOSA) 산하의 초거대AI추진협의회는 “학습 데이터에 대해 적법한 권한을 확보할 것을 권고한다”는 문구를 삭제해야 한다는 내용의 건의서를 문체부에 제출했다. 이들은 “권고에 따르면 방대한 데이터의 이용 목적과 기간, 대가 등을 건건이 협의·계약해야 한다는 의미로 풀이될 수 있어 글로벌 경쟁에 뒤처질 수 있다”고 주장했다.

업계 관계자는 “해외 빅테크 기업들이 한국어를 비롯한 모든 공개 데이터를 학습 후 선두기업으로 올라선 후 규제를 만들어 후발주자를 막고 있어 대등한 경쟁이 힘들어 지고 있다”며 “플랫폼공정경쟁촉진법에 이어 이번 가이드라인이 AI 발전에 또 다른 족쇄가 될 수 있다”고 말했다.

최경진 한국인공지능법학회장(가천대 법학과 교수)는 “저작권이 명확한 정제된 정보 외에 성격이 불분명한 공개된 정보를 어떻게 쓸 것인가가 향후 핵심 논점이 될 것”이라며 “혁신과 저작권 보호 사이에 균형을 찾을 수 있도록 구체적인 논의를 시작해야 한다”고 말했다.

김은성 기자 kes@kyunghyang.com

Copyright © 경향신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?