챗GPT 저작권 침해 소송 증거 삭제한 오픈AI…고의인가? 실수인가?

챗GPT 개발사 오픈AI가 챗GPT 학습 과정에서 저작권을 침해했다는 논란이 지속되고 있다.

일부 언론사와의 소송에서는 승리했지만, 아직까지 뉴욕타임스(NYT)와의 재판이 진행 중이다. 뉴욕타임스와의 재판은 저작권 침해 논란과 관련, 언론계와 인공지능(AI) 기업간의 승패를 결정지을 가장 중요한 사건이 됐다.

뉴욕타임스가 승소할 경우 AI 업계 전반에 줄소송이 잇따를 수 있기 때문이다. 법적 공방이 이어지는 가운데 오픈AI가 저작권 침해 소송 증거로 사용될 데이터를 삭제한 것으로 전해졌다.

오픈AI는 이를 '시스템 오류'라고 해명했고, 뉴욕타임스 측은 '의도적이다'라는 입장을 밝혔다. 22일(현지시간) 더 버지 등 외신보도에 따르면 뉴욕타임스의 법무팀은 150시간에 걸쳐 자사의 뉴스 기사가 포함된 사례를 챗GPT에서 찾았다고 한다.

그러나 법무팀이 증거 데이터를 검토하는 동안 많은 증거 데이터가 삭제됐다고 전해졌다.

뉴욕타임스가 법원에 제출한 서류에 오픈AI 엔지니어들이 증거 데이터 중 일부 검색 데이터를 모두 삭제했다고 주장했다.

이후 오픈AI는 대부분의 데이터를 직접 복구했지만, 원본 파일명, 폴더 구조 등이 손실돼 소송에 차질을 빚고 있다는 게 뉴욕타임스 법무팀의 설명이다.

이로 인해 뉴욕타임스 법무팀은 일주일 동안 작업했던 데이터를 손실했다. 이를 놓고 뉴욕타임스 변호사 제니퍼 메이즐은 "삭제된 데이터로 인해 뉴욕타임스 기사가 오픈AI의 AI 모델에 어떻게 활용됐는지 입증하는 데 어려움을 겪고 있다"라고 밝혔다.

오픈AI 측은 데이터가 삭제된 것을 두고 단순한 '시스템 결함'이었다고 주장하고 있다. 그러나 뉴욕타임스 변호사는 "믿을 이유가 없다"라고 언급했다.

앞서 뉴욕타임스는 법원의 조치에 따라 오픈AI의 훈련 데이터에 접근해 자사의 기사 사용 여부를 살펴보고 있다. 한편 뉴욕타임스는 이미 소송을 진행하는 과정에서 100만 달러 이상을 사용한 것으로 전해졌다.

AI포스트(AIPOST) 조형주 기자

■ 보도자료 및 광고, 비즈니스 협업 문의 aipostkorea@naver.com