“빅테크들, 위법 알고도 AI 학습용 데이터 마구잡이 수집”
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
생성형 인공지능(AI) 개발에 사활을 걸고 있는 미국 빅테크(거대 정보기술 기업)들이 저작권과 관련 법을 무시한 채 마구잡이로 데이터를 수집해 자신들의 AI 학습에 사용해 온 것으로 드러났다.
이에 따르면 오픈AI는 GPT-4 모델을 개발 중이던 2021년 기존에 수집한 학습용 데이터가 고갈될 위기에 처하자 유튜브 영상과 팟캐스트 등의 콘텐츠를 무단으로 사용했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
AI 개발 경쟁 속 데이터 고갈되자
“유튜브 등 인터넷 콘텐츠 무단 사용”
생성형 인공지능(AI) 개발에 사활을 걸고 있는 미국 빅테크(거대 정보기술 기업)들이 저작권과 관련 법을 무시한 채 마구잡이로 데이터를 수집해 자신들의 AI 학습에 사용해 온 것으로 드러났다.
뉴욕타임스(NYT)는 6일(현지시간) 챗GPT 개발사인 오픈AI와 구글, 메타(페이스북·인스타그램 모회사) 등의 이 같은 행태를 상세하게 보도했다. 이에 따르면 오픈AI는 GPT-4 모델을 개발 중이던 2021년 기존에 수집한 학습용 데이터가 고갈될 위기에 처하자 유튜브 영상과 팟캐스트 등의 콘텐츠를 무단으로 사용했다.
오픈AI는 그전까지 GPT-3 학습을 위해 깃허브, 위키피디아 등 온라인 무료 오픈소스 플랫폼의 데이터 3000억여개를 수집해 사용했다. 그러나 다음 세대 GPT의 기능 향상을 위해 더 큰 규모의 학습 데이터가 필요해지자 유튜브 콘텐츠 등에 손을 댔다는 것이다. 영상 속 말소리를 받아 적는 ‘위스퍼’라는 자체 프로그램까지 개발해 GPT-4 학습에 사용하기도 했다. 그 결과 지난해 공개된 GPT-4는 재사용이 금지된 유튜브 콘텐츠를 100만 시간 이상 학습한 것으로 알려졌다. NYT는 “오픈AI 직원들은 위법 행위 가능성을 인지하고 있었지만, AI 학습은 정당한 이용 목적에 해당된다고 믿었던 것처럼 보인다”고 전했다.
유튜브 영상의 AI 학습 활용은 유튜브 운영사인 구글도 마찬가지였다. 구글은 유튜브 콘텐츠뿐 아니라 지도·문서 등 다른 구글서비스 이용자들의 자료까지 AI 개발에 활용한다는 의혹을 받고 있다. 지난해 구글은 이용자 정보 활용 범위를 “구글 번역기 등의 언어모델 훈련”으로 제한했던 개인정보 보호 규정을 바꿔 “바드, 클라우드 AI 등 AI 상품 개발”도 포함될 수 있도록 했다.
NYT는 “유튜브 콘텐츠의 저작권이 개별 영상 창작자 소유라는 점과 오픈AI의 유튜브 콘텐츠 활용 사실을 잘 알고 있었으면서도 구글은 이를 모른 척했다”며 “자신들까지 함께 엮일 것을 우려한 모양새”라고 보도했다. 구글 대변인은 “우리는 오픈AI의 행태에 대해 아는 바 없다”며 “구글은 유튜브 콘텐츠의 무단 사용 및 다운로드를 금지하고 있다”고 입장을 내놨다.
메타 역시 페이스북과 인스타그램 게시물뿐 아니라 소설, 에세이, 뉴스기사 등 저작권이 명확한 데이터들까지 무단으로 손을 댄 것으로 드러났다. NYT가 확보한 내부 자료에 따르면 이 회사 AI 담당 부사장인 아흐마드 알달은 임원회의에서 자신의 팀이 이용 가능한 거의 모든 인터넷 콘텐츠를 사용했다고 말했다. 회의에선 이런 행위가 소송으로 이어진다 해도 ‘경쟁력 있는’ AI 개발을 위해선 더 많은 데이터 확보가 중요하다는 논의도 이뤄졌다.
NYT는 “일부 AI 개발사들은 데이터 고갈을 해결하기 위해 AI가 생성한 데이터로 다시 AI를 학습시키는 ‘합성 데이터’ 활용 방안도 연구 중”이라고 전했다.
신창호 선임기자 procol@kmib.co.kr
GoodNews paper ⓒ 국민일보(www.kmib.co.kr), 무단전재 및 수집, 재배포금지
Copyright © 국민일보. 무단전재 및 재배포 금지.
- 대파 인형에 대파 와이퍼까지 등장… ‘인증샷’ 릴레이
- ‘만취 난동’ 190㎝ 남성… 170㎝ 경찰, 단숨에 제압
- 부부싸움 말리는 초등생 아들, 발로 걷어찼다 벌금형
- 황대헌, 박지원과 또 충돌…“우연 4번은 고의” 비난 폭주
- ‘외모 악플’ 시달린 보아, 은퇴 암시?…의미심장 SNS글
- 선물 팔았다고 전 여친 폭행… ‘중고 패딩’ 매수 가장 30대 집유
- 퇴근 후 국밥 먹다가…‘저혈압 쇼크’ 노인 살린 경찰
- 치매 노모 숨진 뒤 60대 두 딸도…집에선 ‘메모’ 나왔다
- “번호 교환할래?” 학원 가던 초등생 치근덕… 30대 집유
- ‘거기까지 어떻게 갔니?’…3200㎞ 떨어진 곳에서 찾은 반려견