‘짝퉁’ AI 콘텐츠의 습격[IT 칼럼]
2022년 출시 이후 2년 만에 1조3000억원 가치로 성장한 AI 기반 검색사이트. 모든 지식이 시작되는 곳이라는 슬로건으로 검색 질서를 뒤흔들어 놓고 있는 스타트업. 제프 베이조스 등 빅테크 거물들이 투자하며 전 세계의 주목을 한 몸에 받는 신생 테크기업. 퍼플렉시티를 수식하는 화려한 문장은 지금도 끊임없이 늘어나는 중이다. 물론 구글의 대항마, 오픈AI 출신 창업가라는 문구도 빠지지 않고 언급된다.
승승장구를 거듭하던 퍼플렉시티의 가도에 최근 제동이 걸리는 사건이 발생했다. 소위 ‘포브스’ 탐사보도 도둑질 논란이다. 발단은 이렇다. 퍼플렉시티가 콘텐츠 데이터 확보를 위해 내놓은 ‘페이지’라는 일종의 블로그 서비스에 ‘포브스’의 탐사 기사를 도용한 한 편의 글이 올라왔다. 퍼플렉시티는 자사 검색에서 이 페이지를 주요한 출처로 인용했다. 정작 첫 원본 기사를 작성했던 ‘포브스’ 기사는 뒤로 밀려났다. 항의를 받자 이번에는 도용된 기사를 바탕으로 제작된 유튜브 영상 링크가 선순위에 노출됐다. 뿔이 난 ‘포브스’는 즉시 법적 조치를 할 것이라고 엄포를 놨고, 결국 퍼플렉시티는 광고 수익 공유라는 타협안을 제시하고 백기를 들었다. 아직 완전히 해결된 상태는 아니지만 어떤 식으로든 ‘포브스’에 보상책을 제공하고 마무리될 것으로 보인다.
‘포브스’와 퍼플렉시티의 갈등은 AI 검색이라는 신 검색체계에서 벌어진 첫 번째 분쟁 사례다. 학습 데이터의 무단 사용에 대한 법리적 다툼과는 성격을 달리한다. AI 기반의 신 검색체계에서, 원본을 모방한 AI 생성 콘텐츠를 원본보다 우대하는 경향이 일반화할 수 있다는 걸 상징한다. 조금 폄하해 비유하자면 ‘짝퉁’ 콘텐츠의 습격 사건이라 할 만하다. 앞서 언급했듯, 퍼플렉시티가 선순위로 인용한 콘텐츠는 ‘포브스’의 원본 기사 정보를 바탕으로 AI가 생성한 짜깁기 콘텐츠다. 원본 기사의 품질에 비할 바 없을 뿐더러 내용의 밀도도 떨어진다. 하지만 이 짝퉁은 원본 기사보다 더 우월적인 위치를 점유했다. 앞으로 이런 사례는 비일비재해질 것이 분명하다.
국내 포털 블로그 사이트에도 이러한 글이 넘쳐난다. 원본 콘텐츠를 적당히 인용하고, 링크도 걸지 않은 채 검색 최적화용 핵심 키워드를 제목에 부각한다. 최근에는 생성 AI의 도움으로 그럴듯한 추가 정보까지 덧붙여놓는다. 그리고 광고를 붙여 수익을 얻어간다. 이러한 유(類)의 저품질 콘텐츠는 생성 AI의 성능이 높아질수록 그리고 가격이 낮아질수록 더 횡행할 가능성이 크다. 굳이 인간이 공들여 할 만큼 가치 있는 작업이 아니기도 해서다.
고품질 원본 콘텐츠를 생산하는 언론사들과 보상 계약을 체결하기 어려운 신생 검색사이트들은 AI로 적당히 치장한 콘텐츠 생산을 부추기며 부족한 정보를 채워가는 중이다. 어차피 사용자들은 신 검색체계에서 원본 콘텐츠에 링크를 타고 들어가는 수고를 더는 감내하지 않는다. 골자가 정리된 AI 요약문만 보고 정보 소비를 종료한다. 링크 경제의 위력이 저물어가면서 ‘원본성의 하대, 저품질의 우대’가 현실이 되는 중이다. 상대적으로 자금이 넉넉하지 않은 퍼플렉시티가 취했던 방법이다.
이 풍경의 끝이 어디일지는 가늠하기 어렵다. 확실한 건 원본성의 아우라가 저품질 생성 콘텐츠의 장막으로 가려지는 순간, 원본 제작의 동기는 약화할 수밖에 없다는 것이다. 굳이 돈과 시간을 들여 하대받을 고품질 콘텐츠를 만들 하등의 이유가 없다. 저품질 콘텐츠의 습격은 조만간 일상이 될 것이다. 콘텐츠 가치에 둔감한 AI 빅테크들은 이를 방치할 확률이 높다. 허위정보의 범람만큼이나 경계해야 할 우리의 내일이다.
이성규 미디어스피어 대표
Copyright © 주간경향. 무단전재 및 재배포 금지.