인공지능의 원죄와 새로운 생태계

송해엽 군산대 미디어문화학부 교수 2024. 8. 20. 16:10
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[언론 다시보기] 송해엽 군산대 미디어문화학부 교수
송해엽 군산대 미디어문화학부 교수

퍼플렉시티(Perplexity)는 2022년에 출시된 인공지능(AI) 언어모델 기반 검색 엔진이다. 기존 검색 엔진이 관련성 높은 링크 목록을 제공하는 것과 달리 퍼플렉시티는 질문의 문맥을 이해하고 개인화된 검색 결과를 요약해서 제공한다. 이용자는 추가 질문을 통해 연속된 맥락에서 검색이 가능해 기존 검색과 차별화된 이용자 경험이 가능하다. 다양한 활용 가능성으로 인해 2024년에는 30억 달러(약 4조원)의 기업 가치를 인정받기도 했으며, 월간 1500만명 이상이 접속하고 있다. 하지만 실시간으로 인터넷에 접속하고 자연어로 답변을 제공하는 검색엔진 챗봇이라는 설명과 달리 퍼플렉시티가 웹사이트 콘텐츠를 무단 스크랩하고 있다는 비판이 제기됐다.

인터넷 사이트 운영자는 로봇 배제 표준(robots.txt)이라고 부르는 작은 문서 파일을 통해 웹 크롤러가 사이트의 어떤 부분에 접근할 수 있는지 명시한다. 이는 법적 구속력이 있는 문서는 아니지만 인터넷 초기부터 상호 신뢰에 기반한 사회적 계약으로 작동해왔다. 예를 들면, 구글봇은 허용된 페이지만 수집하고, 이러한 정보를 검색 결과에 반영하는 방식으로 운영한다. 와이어드 기사에 따르면 퍼플렉시티는 비공개 IP 주소를 사용하여 웹사이트의 방화벽을 회피하고, 원작자의 허락 없이 콘텐츠를 수집하는 것으로 밝혀졌다. 와이어드를 포함한 유명 잡지를 소유한 미디어 기업 콘데 나스트(Conde Nast)는 퍼플렉시티가 자사 웹사이트 콘텐츠를 무단 수집하고 있다고 주장하며, 저작권 침해와 표절 혐의로 고발했다.

퍼플렉시티 문제는 인공지능 기술이 저작권 문제를 어떻게 다루어야 하는지에 관한 이야기이다. 인공지능 모델이 학습을 위해 뉴스 기사 같은 고품질 콘텐츠를 무단으로 사용하고 있다는 지적이 있다. 이는 퍼플렉시티뿐만 아니라 다른 인공지능 기업 역시 마찬가지다. 뉴욕타임스는 오픈AI와 구글이 유튜브 동영상을 전사하고 추가 학습을 위한 데이터로 활용하면서 분쟁의 소지를 가져오고 있다고 보도했다. 뉴욕타임스 팟캐스트에서 마이클 바바로 기자는 이와 같은 저작권 위반을 “AI의 원죄”라고 불렀다. 하지만 우리는 이러한 주제에서 저작권법의 세부 사항을 논의하는 것보다 모두에게 이익이 될 수 있는 생태계를 구축하는 방법에 관심을 기울일 필요가 있다.

모두에게 이익이 되는 생태계란 생성형 인공지능이 창출하는 가치를 다양한 이해관계자가 기여한 비율에 따라 배분하는 구조이다. 저작권이 있는 콘텐츠를 AI 훈련 데이터로 사용할 때는 그에 대한 적절한 보상 체계가 마련되어야 하며, AI가 생성한 결과물도 원작자의 권리를 존중하는 방향으로 나아가야 한다는 것이다. 생각해볼 수 있는 사례는 유튜브 시스템이다. 유튜브는 저작권자에게 일정한 사용료를 지불하고 이용자의 구독료 일부를 저작권자에게 배분하는 보상 시스템을 가지고 있다. 또한 콘텐츠ID 시스템은 저작권 소유자가 제출한 오디오 및 비디오 파일 데이터베이스를 사용하여 저작권으로 보호되는 콘텐츠와 일치하는 것을 식별하여 차단한다.

현재 대규모 인공지능 제조 업체는 모든 콘텐츠를 자사 서비스의 일부로 하고자 한다. 이와 같은 중앙 집중식 구조에서 인공지능 기업이 저작권을 침해하거나 보상 없이 콘텐츠를 사용한다면, 콘텐츠 제작자 입장에서 선택의 폭은 매우 좁을 수밖에 없다. 최근 퍼플렉시티는 계속된 비판에 대응하기 위해 언론사와 수익 공유 계약을 발표했다. 타임(Time), 더 슈피겔(Der Spiegel), 텍사스 트리뷴(Texas Tribune)을 포함한 6개 언론사와 협력하여, 광고 수익 일부를 분배하는 모델을 도입했다. 이러한 변화를 긍정적으로 보는 언론인도 있지만, 장기적으로 중앙 집중식 모델 내 수익 배분 구조는 언론에 또 다른 형태의 종속일 수 있다. 팀 오라일리는 인공지능 생태계도 초기 개방형 웹 구조와 유사하게 여러 주체들 간의 자발적 협력에 기반해 분산되어야 한다고 말한다. 개방형 구조는 창작자가 자신의 콘텐츠에 대한 더 많은 통제권을 가지고 있으며, 플랫폼에 의존하지 않고도 스스로 원하는 방식으로 콘텐츠를 배포하고 수익을 창출할 수 있다. 향후 모두에게 이익이 되는 생태계가 어떤 모습이어야 하는지 고민이 필요한 순간이다.

Copyright © 기자협회보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?