한국어 데이터 학습 생성형 AI 속속 나와… 한국도 소송 잇따를듯

안상현 기자 2023. 8. 26. 03:00
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

네이버의 ‘하이퍼클로바X’, 카카오의 ‘코(Ko)GPT 2.0′, LG의 ‘엑사원 2.0′ 등 올 하반기 한국어 데이터를 대량 학습한 생성형 인공지능(AI) 서비스가 대거 출시·예고되면서 한국에서도 AI 저작권 관련 소송이 급증할 수 있다는 전망이 나온다. 생성형 AI 학습 과정에서 동의 없이 수집된 데이터는 콘텐츠 저작권과 개인정보 침해 논란으로 이어질 수밖에 없고, 원본 데이터가 따로 있는 AI 콘텐츠의 저작권을 인정할 수 있느냐 하는 2차 문제도 불거지기 때문이다. 법조계 IT 전문가들은 “생성형 AI 원리상 저작권 복제·전송은 피할 수 없다”고 했다.

'네이버 AI' 소개하는 최수연 대표 - 네이버 최수연 대표가 24일 서울 강남구 그랜드인터컨티넨탈 서울파르나스에서 열린 콘퍼런스에서 네이버의 AI '클로바X'를 소개하고 있는 모습. /뉴스1

해외에선 이미 생성형 AI 개발사를 상대로 한 법적 분쟁이 활발하다. 미국 법률회사 클락슨은 지난 6월과 7월 각각 ‘챗GPT’ 개발사 오픈AI와 ‘바드’ 개발사 구글을 상대로 저작권 및 개인정보 침해에 대한 집단소송을 제기했다. 익명의 개인들을 대리한 클락슨은 “AI 업체들은 단순한 개인정보를 넘어서 온라인에서 일어나는 사적인 대화, 의료 데이터 등 민감 정보까지 수집 중”이라며 “데이터 소유자 동의 없이 활용했을 경우 처벌받아 마땅하다”고 했다. 오픈소스 코드 공유 플랫폼 깃허브를 인수한 마이크로소프트(MS) 역시 프로그래머들로부터 고소당했다. 깃허브 이용 프로그래머들이 자신들이 올려둔 코드를 MS가 동의 없이 도용해 자사 생성형 AI에 학습시켰다는 주장이다. 영국에선 올 1월 사진·이미지 제공 업체 게티이미지가 자사의 유료 이미지 수백만 개를 불법 복사·처리했다는 이유로 이미지 생성 AI 도구 ‘스테이블 디퓨전’ 개발사 스태빌리티AI를 영국 런던 고등법원에 고소했다.

국내에서도 AI 저작권 소송을 대비해 관련 법을 정비하고 가이드라인을 마련해야 한다는 목소리가 높다. 지식재산권 전문 황규목 변호사는 “개인의 노력이 반영된 성과물일 경우 부정경쟁방지법 위반으로 민사상 손해배상 책임을 질 수 있다”며 “문제 삼기 시작하면 모두 문제가 될 수 있다”고 했다. IT 전문인 민태호 변호사는 “관계 기관들이 모여 AI 저작권에 대한 가이드라인을 우선 도출해야 한다”고 했다.

Copyright © 조선일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?