정보통신정책연구원 “생성형 AI 학습 데이터 세트, 저작권 침해 논란서 자유로울 수 없다”
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
생성형 AI의 학습을 위한 데이터 세트(Dataset)가 저작권 침해 이슈에서 벗어날 수 없다는 지적이 나왔다.
27일 정보통신정책연구원이 최근 발간한 '생성형 AI와 저작권 현안' 보고서는 "인터넷에 공개된 정보는 이용 허락 조건에 맞지 않게 이용했다면 저작권 침해로부터 자유로울 수 없다"고 밝혔다.
보고서는 생성형 AI가 데이터로 기계 학습해 구축한 결과물인 AI 모델의 저작권 침해 주체도 해당 서비스를 제공한 사업자가 돼야 한다고 주장했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
생성형 AI의 학습을 위한 데이터 세트(Dataset)가 저작권 침해 이슈에서 벗어날 수 없다는 지적이 나왔다.
27일 정보통신정책연구원이 최근 발간한 ‘생성형 AI와 저작권 현안’ 보고서는 “인터넷에 공개된 정보는 이용 허락 조건에 맞지 않게 이용했다면 저작권 침해로부터 자유로울 수 없다”고 밝혔다. 그러면서 “저작권이 없거나 허락된 경우라면 침해로부터 자유로울 수 있기 때문에 가급적 저작권 이슈에서 자유로울 수 있는 데이터를 사용해야 하나, 사실상 이를 확인하는 것은 어려운 작업이다”라고 했다.
보고서는 “AI 모델을 위해 만들어지는 데이터 세트는 인터넷에 공개된 정보를 크롤링해 제작되고 있다”며 “개인정보가 포함된 경우에는 개인정보보호법 위반에 해당할 수 있다”고 지적했다. 크롤링은 웹사이트·하이퍼링크·데이터·정보 자원을 자동화된 방법으로 수집·분류·저장하는 활동을 말한다.
보고서는 생성형 AI가 데이터로 기계 학습해 구축한 결과물인 AI 모델의 저작권 침해 주체도 해당 서비스를 제공한 사업자가 돼야 한다고 주장했다. 현행 법률은 문제에 대한 책임을 사람에게 지우고 있어 챗GPT 같은 생성형 AI 서비스가 책임의 주체가 될 수 없으며, 생성형 AI의 이용자도 일종의 도구를 이용하는 것이기 때문에 이들에게 그 결과에 대한 책임을 지울 수 없다는 것이다.
보고서는 “데이터의 크롤링이나 TDM(텍스트와 데이터 마이닝), 기계 학습 과정은 공공성을 인정받을 가능성도 있다는 점에서 항변을 주장할 수 있을 것이며 실제 인정받을 가능성도 있다”고 했다. 또 “저작권자의 권리를 침해하면서도 수익까지 독점하는 것은 형평성의 원칙에 위배될 수 있다”며 “확대된 집중 관리나 보상금 청구권을 고려해야 한다”고 덧붙였다.
- Copyright ⓒ 조선비즈 & Chosun.com -
Copyright © 조선비즈. 무단전재 및 재배포 금지.
- 무비자에 급 높인 주한대사, 정상회담까지… 한국에 공들이는 中, 속내는
- 역대급 모금에도 수백억 원 빚… 선거 후폭풍 직면한 해리스
- 금투세 폐지시킨 개미들... “이번엔 민주당 지지해야겠다”는 이유는
- ‘머스크 시대’ 올 것 알았나… 스페이스X에 4000억 베팅한 박현주 선구안
- [단독] 김가네 김용만 회장 성범죄·횡령 혐의, 그의 아내가 고발했다
- 4만전자 코 앞인데... “지금이라도 트럼프 리스크 있는 종목 피하라”
- 국산 배터리 심은 벤츠 전기차, 아파트 주차장서 불에 타
- [단독] 신세계, 95年 역사 본점 손본다... 식당가 대대적 리뉴얼
- [그린벨트 해제後]② 베드타운 넘어 자족기능 갖출 수 있을까... 기업유치·교통 등 난제 수두룩
- 홍콩 부동산 침체 가속화?… 호화 주택 내던지는 부자들