생성형 AI 공정이용 논쟁의 이동: 학습에서 시장 대체까지 [강민주의 디지털 법률 Insight]

"복제냐 학습이냐" 논쟁 넘어
'기억·대체'로 쟁점 이동
역출 논란·시장 잠식 우려
공정이용 판단 기준 재편 압박
법적 불확실성 커지자
'데이터 대가 지급' 협력 모델 부상

한경 로앤비즈의 'Law Street' 칼럼은 기업과 개인에게 실용적인 법률 지식을 제공합니다. 전문 변호사들이 조세, 상속, 노동, 공정거래, M&A, 금융 등 다양한 분야의 법률 이슈를 다루며, 주요 판결 분석도 제공합니다.

얼마나 '기억'하고 어떻게 '대체'하는가

생성형 AI의 저작권 충돌에 대한 초기 논쟁이 "데이터 학습이 복제권 침해인가"라는 원론적 수준이었다면, 최근에는 AI가 저작물을 얼마나 '기억'하고 있으며, 그것이 원저작물 시장을 어떻게 '대체' 하는가라는 실체적 갈등으로 옮겨가고 있다.

이러한 흐름 속에서 우리나라는 지난 2월 문화체육관광부와 한국저작권위원회가 발표한 「생성형 인공지능의 저작물 학습에 대한 저작권법상 공정이용 안내서」를 발표 공정이용 판단에 대한 구체적 기준을 제시하였다.

위 안내서는 AI 학습의 전 과정(수집-전처리-학습-평가)에서 필연적으로 발생하는 복제의 법적 성격을 명확히 하는 한편, 저작권법 제35조의5에 따른 공정이용 판단 기준을 다음과 같이 구체화하고 있다.

- 제1요소(이용의 목적 및 성격) : 학습 결과물이 원저작물을 단순히 대체하는 것이 아니라 새로운 가치를 부여하는 '변형적 이용'인지가 핵심이다. 비영리·연구 목적이거나, 특정 저작물의 재현을 거부하는 기술적 조치를 취한 경우에는 유리하게 고려되고, 특정 저작물을 과도하게 학습시키거나 모방 등으로 기존 저작물의 경제적 대체재로 기능하는 경우 불리하게 평가된다.

- 제2요소(저작물의 종류 및 용도) : 사실·정보 전달 위주의 저작물은 공정이용 인정 가능성이 높으나, 창작성이 높은 문학, 예술적 저작물을 학습에 이용할 때는 보다 엄격한 판단이 이루어진다.

- 제3요소(이용된 부분의 비중 및 중요성) : AI 모델 구조상 저작물 전체 학습이 기술적으로 불가피한 면이 있으나, 이용 과정에서 원저작물의 핵심 표현을 직접 재현되거나 결과물이 동일 또는 대체가능한 형태인 경우 공정이용 인정에 불리하게 작용한다.

- 제4요소(시장 및 가치에 미치는 영향) : AI 서비스가 원저작물의 현재 또는 잠재적 시장 수요를 대체하거나 이용허락 기회를 훼손하는지가 중요하다. 생성된 결과물이 원저작물과 독립적 효용을 가지게 되거나 원저작물의 시장 수요에 직접적 영향을 미치지 않는 경우 유리한 요소가 될 수 있고, 결과물에 원저작물의 핵심 표현이 재현되어 원저작물의 잠재적 시장이나 수요에 부정적 영향을 미치는 경우에는 불리한 요소로 작용한다.

AI, 시장 경쟁 해쳐…"원본사이트 이용률 줄어"

그동안 AI 기업들은 AI 학습이 도서관에서 수천 권의 책을 읽고 지식을 습득하는 과정과 본질적으로 다르지 않은 '비표현적 이용'에 해당한다거나, 학습 과정에서 추출되는 것은 단어 간 통계적 확률에 불과해 개별적 표현이 아니라는 점, 그리고 AI 학습의 사회적·공익적 효용이 크다는 점 등을 근거로 공정이용을 주장해왔다.

그런데 뉴욕타임스(NYT)가 Open AI를 상대로 제기한 소송에서 GPT-4가 뉴욕타임즈의 유료 기사를 100페이지 이상 거의 동일하게 출력한 사례를 증거가 제출되면서, 공정이용을 둘러싼 논쟁은 새로운 국면에 접어들었다.

이러한 현상은 학습에 사용된 콘텐츠를 거의 그대로 재현해내는 것으로, 흔히 '역출'이라고 불린다. 이와 같은 역출 현상은 공정이용 제1요소인 '변형적 이용'의 성격을 약화시키고, 제3요소인 '핵심 표현의 재현'에 해당 공정이용 인정에 부정적으로 작용할 수 있다.

나아가 AI 모델이 사실상 '유료 구독 시장의 대체재'로 기능하고 있음을 보여준다는 점에서 제4요소인 '시장 영향'에도 중요한 영향을 미친다. OpenAI는 이러한 현상이 매우 예외적인 경우라고 주장하고 있으나, 향후 소송 과정에서 역출 현상의 발생 빈도와 구조적 특성, 그리고 이용자의 행태(유료 콘텐츠를 대체하려는 수요가 존재하는지 여부)가 구체적으로 드러날 것으로 보인다.

또한 제4요소 '시장 영향성'과 관련해, 최근 발표된 통계를 보면, 구글의 AI 개요 기능 도입 이후 원본 사이트 클릭률이 약 40% 이상 감소했다는 분석도 존재한다. 이는 AI 요약 서비스가 언론사의 구독 및 광고 수익을 직접적으로 대체할 가능성을 시사하며, 이러한 변화는 '잠재적 시장 가치의 훼손'을 입증하는 근거로 활용될 수 있다.

이처럼 공정이용에 대한 분쟁의 흐름이 변화하고 있는 중 국제 사회 역시 여러 판결을 내고 있다.

영국(Getty Images v. Stability AI) 법원은 모델 가중치가 원본의 저장소는 아니라고 보면서도, 결과물에 나타난 워터마크에 대한 관리 책임을 인정하였다.

또한 독일 (GEMA v. OpenAI) 법원은 AI 모델이 저작물을 '암기'해 재현할 수 있는 상태로 만드는 것 자체를 복제권 침해로 본 바 있다.

'공정한 이용' 위한 "전략적 거래·공유 모델"

이와 같이 AI의 무단 학습을 공정이용으로 정당화하는 데 법적 불확실성이 커지면서, 시장에서는 점차 수익 공유 모델로의 전환이 이루어지고 있다.

예컨대 Meta는 언론사와의 계약을 통해 연간 수천만 달러를 지급하고 데이터를 제공받는 방식의 협력을 추진하고 있으며, AI 답변에 기여한 콘텐츠의 비중을 측정해 수익을 배분하는 모델이나, 기계가 인식할 수 있는 라이선스 규약을 통해 자동으로 이용허락과 대가 지급이 이루어지는 체계에 대한 논의도 활발히 진행되고 있다.

향후 AI 기업들은 단순히 공정이용이라는 불확실한 방어 논리에 의존하기보다는, 데이터를 하나의 자산으로 보고 정당한 이용 대가를 전제로 한 거래 구조를 구축하려는 방향으로 나아갈 가능성이 크다.

공정이용 법리가 어떠한 기준으로 정립될지, 그리고 권리자와 이용자 간 이해관계가 어떤 방식으로 재편될지 지속적인 관찰이 필요하다.

한국경제에서 직접 확인하세요. 해당 언론사로 이동합니다.