나도 모르게 날 학습하거나 사진 가져가는 '그놈'…AI 기술의 빛과 그림자 [스프]

안혜민 기자 2024. 10. 3. 09:03
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[마부뉴스] 데이터로 보는 AI 기술
 

하나의 이슈를 데이터로 깊이 있게 살펴보는 뉴스레터, 마부뉴스입니다.
 

하루가 멀다 하고 새로운 AI 기술이 발표되고 있습니다. 지난 9월 25일엔 메타 CEO 마크 저커버그가 '메타 커넥트 2024' 행사에서 새로운 AI 모델과 증강현실(AR) 안경의 프로토타입을 공개하기도 했죠. 이 안경을 쓰면 메타의 AI 비서를 이용해 다양한 업무를 수행할 수 있습니다. 요리 레피시도 순식간에 검색할 수 있고, 이미지 합성 및 생성도 손쉽게 해낼 수 있죠. AI 기술이 점점 발전하면서 AI 기술을 책임감 있고 윤리적으로 사용해야 한다는 목소리도 점점 커지고 있습니다.

AI 기술 발전에 필수 요소인 학습 과정에서 개인정보가 무단 도용될 수도 있고, 저작권을 침해하는 등 심각한 보안 문제가 발생할 수 있기 때문이죠. 오늘 마부뉴스는 AI 기술의 명과 암을 다루었던 세 편을 소개해드립니다.
 

AI가 내 사진을 마음대로 가져간다면?

이젠 글자만 넣으면 논문 수준의 글이 나오고, 음악이 나오고, 그림과 비디오가 나오는 시대입니다. 이렇게 생성형 AI가 수많은 것들을 생산할 수 있었던 기반은 방대한 데이터를 학습했다는 데에 있죠. 생성형 AI는 대부분의 머신러닝 알고리즘과 마찬가지로 수많은 데이터를 학습해 그 패턴을 식별하고 복제해 새로운 무언가를 만들어냅니다. 문제는 학습하기 위해 긁어온 웹상의 수많은 데이터들이 저작권과 얽혀있다는 겁니다.

게임 <매직 더 게더링>의 컨셉아트에 참여한 그렉 루트코프스키는 이쪽 컨셉아트 분야에서 상당히 잘나가는 사람이라 텍스트를 그림으로 바꿔주는 프로그램 Stable Diffusion에서만 그의 이름이 93,000번가량 사용되었다고 하죠. 처음에는 좋았다고 합니다. 많은 사람들로부터 자신의 작품이 인정받고 있다는 거니까요. 하지만 시간이 가면 갈수록 자신이 작업하지 않은 작품에 버젓이 자신의 이름이 달려있는 경우가 많아지면서 문제가 시작됐어요. 이런 상황이 지속되면 아티스트 수익에 타격이 올 수밖에 없잖아요. 그렉에게 따로 부탁하지 않아도 그렉의 일러스트 스타일대로 만들 수 있게 되면 굳이 돈을 들일 필요가 없게 되는 거니까요.

결국 그렉은 자신의 홈페이지에 “No to AI generated images”라는 공지를 걸어뒀습니다. 더 이상 자신의 작품을 허락 없이 AI에 사용하지 말라는 경고였죠. 최근엔 AI 기업들로부터 자신들의 작품과 데이터를 보호하는 유럽 예술가 단체인 EGAIR(European Guild for Artificial Intelligence Regulation)에 가입해 저작권 보호를 위한 활동을 계속해 나가고 있어요.


그렉과 같은 아티스트들이 얼마나 될지 확인하기 위해선 생성형 AI의 학습 데이터를 살펴봐야 할 텐데 그게 쉽지만은 않습니다. AI 업체들이 그 데이터를 공개하고 있지 않고 있기도 하거니와, 설령 확인이 된다고 하더라도 이미 학습된 모델에다가 언제든지 추가로 학습시킬 수 있는 가능성이 있거든요.

그래도 Stable Diffusion이 공개한 학습 데이터를 한 번 살펴봤어요. WAXY라는 곳에서 분석한 자료인데 훈련 이미지 1,209만 6,835개를 정리해 봤습니다. 물론 최초 훈련 때 사용한 23억 개의 데이터에 비교하면 조족지혈 수준이지만요! 1,200만 개의 이미지를 살펴봤을 때 가장 많이 등장한 아티스트는 누구였을까요? '빛의 화가'라는 별칭을 가진 토마스 킨케이드가 9,268번으로 가장 많이 등장했습니다. 그다음으로 2위를 차지한 건 빈센트 반 고흐였어요. 8,376번 등장했죠. 상위 25명의 아티스트 중에 22명의 작가들이 이미 세상을 떠난 상태였습니다. 자신의 작품이 AI 학습에 사용되었는지를 확인할 수 있는 작가는 단 3명뿐이었죠.

▶ 남은 이야기 더 보기
[ https://premium.sbs.co.kr/article/5j4biWex1G ]
 

AI로 만든 커버곡, 문제 없을까?

AI 기술이 점점 발전하면서 우리는 과거엔 경험하지 못한 콘텐츠를 소비하고 있습니다. 우선 존 레논과 조지 해리슨이 하늘의 별이 되었지만 우리는 비틀즈의 신보를 들을 수 있게 됐죠. 2023년 11월 2일, 비틀즈의 마지막 노래 <Now and Then>이 담긴 싱글 앨범이 발매됐습니다. 1970년대 데모로 녹음한 30대의 존 레논의 목소리에다 1995년 조지 해리슨의 기타 연주, 그리고 현재의 폴 매카트니의 목소리와 링고 스타의 드럼 연주가 만나서 탄생한 곡이죠. 비틀즈의 이 마지막 신곡은 미국 아이튠즈 차트 1위에 오르는 기염을 토하기도 했습니다.

비틀즈뿐 아니라 고인이 된 뮤지션들을 AI로 되살린 사례는 많습니다. 거북이의 리더이자, 심근경색으로 사망한 터틀맨 음성을 AI로 복원하기도 했고요. 김현식, 신해철 등의 뮤지션을 되살려 그들의 목소리를 듣는 건 이제 특별한 일이 아니게 되었죠. 물론 일각에서는 고인을 돈벌이에 이용한다는 비판도 있는 게 사실입니다. 또 한편으로는 그만큼 뮤지션을 추억하고 싶어 하는 팬들을 위한 콘텐츠가 될 수 있다고 옹호하는 목소리도 있고요.

하지만 문제는 저작권자의 허락 없이 나온 AI 콘텐츠들입니다. 위에서 얘기한 것들은 유족들과 합의를 거쳐서 나온 것이니만큼 문제가 없지만, 그렇지 않은 AI 커버곡들은 상황이 다르니까요. 일단 우리나라의 저작권법에서 규정하는 저작물에 목소리는 포함되어 있지 않습니다. 그러니까 다른 사람의 목소리 자체를 활용해서 무언가를 만드는 건 저작권 침해라고 할 순 없죠.

그렇다면 괜찮은 걸까요? 그렇진 않습니다. 왜냐하면 목소리에는 없는 저작권이 음원에는 있거든요. 즉 음원을 활용해 만들어진 AI 커버곡은 저작권자의 허락을 받지 않았다면 저작권법 위반입니다. 게다가 목소리가 저작권은 없지만 헌법상의 기본권을 가진다는 취지로 '음성권'이 인정된 바 있기 때문에 헌법 위반 여지가 있기도 하죠.

하지만 그럼에도 불구하고 AI 커버곡은 많은 사람들에게 선택받고 있습니다. 기업들이 수요가 몰리는 상품을 두고 가만히 있지는 않겠죠. 구글과 유니버설 뮤직은 이런 딥페이크 음악을 합법화하는 방안을 발 빠르게 추진 중입니다. 생성형 AI를 활용해 합법적으로 음반을 제작할 수 있는 허가증을 부여하는 식으로 말이죠.

▶ 남은 이야기 더 보기
[ https://premium.sbs.co.kr/article/Mnk8CUtytBx ]

(남은 이야기는 스프에서)

안혜민 기자 hyeminan@sbs.co.kr

Copyright © Copyright ⓒ SBS. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?