AI 면책 어디까지… ‘저작권 침해’ 논란

■ 정부, 산업 디지털화 전략
AI 학습 데이터 수집·저장은
‘적법 저작물 해당’ 면책 추진
구체적 지침없으면 혼란 우려
美선 AI 기업에 소송 잇따라

국내외 빅테크 기업들의 초거대 인공지능(AI) 개발 경쟁과 맞물려 데이터 이용권리와 저작권 문제가 큰 논란으로 부상한 가운데 정부가 AI 학습을 위한 저작권 침해 면책기준을 마련하기로 했다. AI 개발에 먼저 뛰어든 미국에선 이미 AI 개발사를 상대로 한 저작권 침해 소송이 잇따르고 있어 국내에서도 이를 둘러싼 논란이 불붙을 전망이다.

정부는 21일 정부서울청사에서 추경호 부총리 겸 기획재정부 장관 주재로 비상경제장관회의 겸 수출투자대책회의를 열고 이 같은 내용을 담은 ‘서비스산업의 디지털화 전략’을 발표했다. 이번 대책은 제조업·서비스업 등 모든 산업과 융합되는 디지털 서비스를 활성화해 국민 일상 편의를 높이고 산업 경쟁력을 강화하기 위해 범정부 종합전략으로 마련됐다.

우선 저작권법 개정을 통해 AI 학습을 위해 데이터를 활용할 경우 저작권 침해가 면책되는 요건과 근거를 마련한다. 정보기술(IT)업계에 따르면 챗GPT 등 생성형 AI를 학습시키기 위해서는 엄청난 양의 데이터가 필요한데, 기업과 기관이 보유한 자체 데이터로는 한계가 있다. 이 때문에 학습용 데이터의 60~70%는 ‘크롤링 (데이터를 자동으로 수집·분류·저장)’을 통해 사용하는 것으로 알려져 있다. 이에 정부는 AI 학습을 위한 크롤링 행위는 저작물에 포함된 사상·감정을 향유하지 않고, 적법한 저작물 접근에 해당함을 명시하기로 했다. 이미 일본과 유럽연합(EU)은 AI의 학습 단계의 저작권 면책규정을 도입하고 있다.

하지만 경제계에서는 포괄적인 면책규정을 두게 되면 콘텐츠 산업계의 투자 의욕을 떨어뜨리고 분쟁을 부추길 수 있다는 우려의 목소리가 나온다. 미국의 경우 AI 학습에 쓰였던 뉴스 기사를 제작한 언론사들이 AI 기업에 소송을 제기하는 등 관련 소송전이 끊이지 않는데, 보다 구체적인 가이드라인이 필요하다고 보는 것이다.

정부는 ‘AI 허브’ 내 산업별 데이터 구축도 확대하기로 했다. AI 허브(aihub.or.kr)는 기업의 AI 제품·서비스 개발 지원 등을 위해 한국어·이미지·음성·영상 등 다양한 AI 학습용 데이터를 구축해 제공하는 공개 플랫폼이다. 스타트업이 AI 서비스 개발에 활용할 수 있는 산업 분야별 데이터 구축을 올해 150종에서 2027년까지 1100종 이상으로 크게 늘린다는 방침이다.

아울러 개인정보가 포함된 공공데이터를 ‘가명처리’해서 민간에 제공할 수 있다는 점을 명확히 하는 방향으로 ‘공공데이터법’과 ‘데이터기반행정법’을 개정하기로 했다. AI의 급격한 성장으로 활용 수요가 빠르게 늘고 있는 영상·음성 등 비정형 데이터에 대해 가명처리 원칙, 식별 위험성 점검 기준, 가명처리 방법·사례를 구체화해 올해 말까지 ‘가명정보 처리 가이드라인’에 반영할 방침이다.

박정경 기자 verite@munhwa.com