[이권호 변호사의 법률 칼럼] 챗지피티(Chat GPT)와 저작권(Ⅱ)

중기&창업팀 2023. 5. 2. 12:55
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

전회 칼럼에서는 챗지피티(Chat GPT)의 저작권 인정 문제에 대해서 살펴보았다. 이번 칼럼에서는 챗지피티(Chat GPT)의 저작권 침해 문제에 대해서 검토해보기로 한다. 이 문제는 현재 세간에서 논의되는 바와 같이 포괄적으로 저작권 침해가 있는지 여부로 접근해서는 안 되며, 저작권법상 어떠한 권리가 침해되는지를 정치하게 분류하여 검토해야 한다. 저작재산권 측면에서는 복제권, 2차적저작물 작성권, 데이터베이스제작자의 권리 침해 여부가 주로 문제되고, 저작인격권 측면에서는 동일성유지권, 성명표시권 침해 여부가 문제될 수 있다.

챗지피티(Chat GPT)는 학습과정에서 엄청난 분량의 데이터 복제가 일어난다. 챗지피티(Chat GPT)는 인간과 유사한 답변을 생성하도록 하기 위하여 대형 언어 모델(Large Language Mode) 방식으로 수백 기가바이트의 텍스트에 대한 훈련을 거쳤다고 한다. 또한 RLHF(Reinforcement Learning from Human Feedback)이라는 강화학습 방법을 통하여 채택하여 챗지피티(Chat GPT)는 수많은 데이터에 대한 피드백 과정이 있었다고 한다.

이 과정에서 필연적으로 저작물에 해당하는 데이터에 대한 복제가 발생한다. 챗지피티(Chat GPT)가 저작권자의 동의를 얻지 못했다면 원칙적으로 저작권법 제16조의 복제권 침해에 해당한다. 이 경우 저작권법상 허용되는 저작물 이용과정에서의 일시적 복제에 해당하여 면책될 수 있는지가 문제 된다. 저작권법 제35조의 2는 "컴퓨터에서 저작물을 이용하는 경우에는 원활하고 효율적인 정보처리를 위하여 필요하다고 인정되는 범위 안에서 그 저작물을 그 컴퓨터에 일시적으로 복제할 수 있다."고 규정하고 있다. 챗지피티(Chat GPT) 학습과정 알고리즘을 살펴보면, 저작물에 해당하는 데이터가 일시적으로 복제되지는 않는 것으로 보이고, 설사 일시적 복제라고 할지라도 학습데이터가 독립적 경제적 가치를 가진다고 할 것이다. 따라서 저작권법 제35조의 2에 기한 면책은 인정되기 어려워 보인다.

2차적저작물 작성권이란 저작자가 자신의 저작물을 원저작물로 하여 2차적저작물을 작성할 권리를 의미한다(저작권법 제22조). 2차적저작물이란 "원저작물을 번역·편곡·변형·각색·영상제작 그 밖의 방법으로 작성한 창작물"(저작권법 제5조)을 의미하고, 원저작물과 동일하지는 않지만 실질적으로 유사한 새로운 저작물로서 인정된다. 챗지피티(Chat GPT)는 질문에 대한 답변 형식으로 텍스트를 생성해 내는데, 형성된 텍스트가 학습된 텍스트와 동일하지는 않지만 실질적으로 유사할 가능성을 배제할 수 없다. 실제 인공지능과 관련한 분쟁 상황에서는 2차적저작물 작성권 침해 여부가 핵심적인 쟁점이 될 것으로 예상된다. 챗지피티(Chat GPT)에 대한 소송은 아니지만, 현재 미국에서 진행되고 있는 미드저니에 대한 소송(Andersen et al v. Stability AI, Midjourney), 스태빌리티에 대한 소송(Getty Images (US) Inc. v. Stability AI Inc.), 깃허브에 대한 소송(DOE 1 et al v. GitHub Inc. et al)에서도 이러한 쟁점이 다투어지고 있다.

데이터베이스제작자는 데이터베이스의 전부 또는 상당한 부분을 복제·배포·방송 또는 전송할 권리를 가진다(저작권법 제93조 제1항). 저작권법상 데이터베이스란 소재를 체계적으로 배열 또는 구성한 편집물로서 개별적으로 그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것을 의미하고(저작권법 제2조 제19호), 데이터베이스제작자는 데이터베이스의 제작 또는 그 소재의 갱신ㆍ검증 또는 보충에 인적 또는 물적으로 상당한 투자를 한 자를 뜻한다(저작권법 제2조 제19호). Open AI가 학습 데이터의 출처 및 크기를 공개하지는 않고 있으나, 기존의 자료들로 추정하면 총 499기가바이트 중 웹크롤링을 통해서 수집한 데이터가 약 410기가바이트, 레딧(Reddit)에서 수집한 게시글이 약 19기가바이트, 책 자료에서 약 67기가바이트, 위키피디아에서 수집한 자료가 약 3기가바이트에 이른다고 한다. 이렇게 수집한 자료 중 정확한 비중은 알 수 없지만, 상당 부분은 저작권법상 데이터베이스제작자의 데이터베이스에서 크롤링을 통해 복제한 것으로 보인다. Open AI가 특정 데이터베이스제작자의 동의를 얻지 않았다면, 이는 위에서 살펴본 복제권 침해와 별도로 데이터베이스제작자의 권리 침해가 문제 될 수 있다.

저작인격권 관점에서 보면, 먼저 동일성유지권 침해 여부가 문제 된다. 동일성유지권이란 저작물의 내용, 형식, 제호의 동일성을 유지할 권리를 의미한다(저작권법 제13조 제1항). 챗지피티(Chat GPT)는 사용자의 질문에 대한 답변 과정에서 학습한 저작물의 내용을 변경이나 수정하게 되므로, 해당 저작권자의 동일성유지권을 침해할 수 있다. 다음으로 성명표시권이란 저작자가 저작물에 실명이나 이명을 표시할 권리를 뜻한다(저작권법 제12조 제1항). 챗지피티(Chat GPT)가 학습한 데이터 중 저작자가 있는 저작물의 비중도 상당할 것으로 보이는데, 챗지피티(Chat GPT)는 텍스트 생성 과정에서 저작자의 실명이나 이명을 전혀 표시하지 않고 있다. 챗지피티(Chat GPT)는 출처 표시를 하지 않는 점에서 비판받고 있다. 이에 반해 마이크로소프트가 새로 출시한 Bing에는 출처 표시가 이루어지고 있다. 따라서 챗지피티(Chat GPT)는 저작자의 성명표시권을 침해할 소지가 있다.

다소 지루하게 느껴질 정도로 구체적인 저작재산권 및 저작인격권의 침해를 검토한 이유는 개별적인 권리 침해 여부가 특정되어야 그 다음 단계의 법적 검토를 진행할 수 있기 때문이다. 또한 본 칼럼의 검토는 챗지피티(Chat GPT)로 인해 주로 침해될 수 있는 저작권법상 권리를 예상한 것이므로, 그 밖에도 다른 저작권법상 권리 침해가 있을 수 있고 이에 대해서는 추후 심도 있는 학술적 연구가 필요하다. 본 칼럼에서 이러한 저작권법상 권리 침해가 발생한다고 단정 짓는 것은 아니며, 면책 사유나 저작권법상 공정이용 조항 적용 문제에 대한 검토가 별도로 이루어져야 한다. 다음 칼럼에서 이 문제를 이어서 살펴보기로 하겠다./글 이권호 변호사

'이권호 변호사 법률 칼럼'은 챗지피티(Chat GPT)와 저작권 등 국내·외 현안과 인사이트, 정보를 제공하는 칼럼으로 이슈가 되고 있는 다양한 법률 정보를 제공하고자 합니다.

이권호 변호사

이권호 변호사
법무법인(유한) 강남 구성원 변호사
법제처 법령해석심의위원
대한상사중재원 중재인

중기&창업팀

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?