챗GPT가 이제는 텍스트뿐 아니라 이미지까지 생성하는 AI로 진화했습니다. 지브리풍 일러스트부터 실사 수준의 그림까지 구현되면서, AI 이미지 생성 기술은 급격한 발전을 거듭하고 있습니다. 하지만 이에 따른 저작권 논란도 함께 커지고 있습니다. 자세한 내용은 정책주간지 'K-공감'을 확인하세요.
챗GPT 그림 실력 폭풍 성장한 이유는?
2024년까지만 해도 챗GPT는 ‘글로 대화하는 인공지능(AI)’이었습니다. 이제 ‘그림도 그리는 AI’로 진화했습니다. 최근 업데이트된 챗GPT(GPT-4o)의 이미지 생성기는 텍스트 기반의 명령어만으로도 실제와 구별하기 어려운 이미지를 만들어낼 뿐만 아니라 명령어를 잘 표현합니다. ‘지브리풍’으로 알려진 그림이 온라인을 뒤덮고 있는 상황이 이를 잘 보여줍니다.
지브리풍은 일본의 유명 애니메이션 제작사 ‘스튜디오 지브리’의 독특한 화풍과 스타일을 모방한 것을 의미합니다. 이러한 스타일은 스튜디오 지브리의 대표작인 ‘센과 치히로의 행방불명’, ‘이웃집 토토로’ 등에서 볼 수 있습니다.
인스타그램, X(옛 트위터), 카카오톡 등에는 AI가 만든 지브리 스타일의 프로필 사진이 넘쳐납니다. 생성형 AI는 어떻게 그림을 그리고 최근 그림 실력이 급격히 좋아진 이유는 무엇일까요? 이에 따른 저작권 논란은 어떤 방향으로 진행되고 있을까요?
디퓨전 방식 넘어 자기회귀 방식 채택
사람이 그림을 그릴 때는 머릿속 상상을 종이에 선과 색으로 옮깁니다. 반면 AI는 수학적 패턴을 사용합니다. 먼저 AI는 수많은 이미지 데이터를 보면서 픽셀 배열을 학습합니다. 픽셀은 0과 1로 이뤄진 만큼 이를 통해 특정한 ‘규칙’을 배운 뒤 사용자가 입력한 프롬프트를 픽셀로 전환, 그림으로 만들어줍니다. AI가 그린 사람의 손가락이 여섯 개이거나 혹은 오른손·왼손의 위치가 바뀌어서 기괴한 경우가 많았는데 이는 AI가 시각적 패턴만을 학습했기 때문입니다. 하지만 최근 AI가 달라졌습니다. 학습 데이터가 많아졌을 뿐 아니라 ‘주석’이 포함된 데이터도 학습이 가능해졌습니다. 즉 ‘사람 손에는 다섯 개의 손가락이 있다’와 같은 개념까지 학습해 그리기에 적용할 수 있게 된 것입니다.
그 위에 ‘디퓨전 모델’이 적용됩니다. 이는 잡음이 가득한 이미지에서 시작해 단계별로 노이즈를 제거하며 점차 형태와 색을 잡아가는 방식입니다. AI에 이미지를 그리라고 명령하면 흐릿한 이미지로 시작해 점점 구체적으로 변하는 모습을 볼 수 있는데 디퓨전 모델이 작동하고 있음을 보여줍니다.
GPT-4o의 경우 기존의 확산(디퓨전) 방식에서 더 나아가 ‘자기회귀 방식(Autoregressive)’을 채택했습니다. 이는 글을 쓸 때처럼 그림을 한 부분씩 순차적으로 그려가는 방식입니다. 시간은 오래 걸리지만 사용자의 지시를 놓치지 않고 세밀하게 반영할 수 있다는 장점이 있습니다. 무엇보다 이미지 생성기가 챗GPT 내부에 직접 통합됐다는 점도 주목할 만합니다. 기존에는 그림을 그리는 AI와 대화하는 AI가 따로 있었지만 이제는 하나의 AI가 둘을 모두 해냅니다. 이로 인해 사용자와 대화를 나누며 더 자연스럽고 정교한 그림을 그릴 수 있게 됐습니다.
실사에 가까워질수록 커지는 저작권 논란
AI가 만들어내는 이미지가 실사에 가까워질수록 법적·윤리적 논란도 커지고 있습니다. 특히 최근 유행 중인 지브리풍 그림은 상업적 활용 가능성과 함께 저작권 문제를 불러일으키고 있습니다. 일반적으로 화풍이나 스타일 자체는 저작권으로 보호받기 어렵습니다. 저작권은 구체적인 ‘창작물’을 보호하는 만큼 어떤 작가의 스타일을 모방했다 하더라도 그 결과물이 완전히 새로운 작품이라면 저작권 침해로 보기 힘듭니다. 스튜디오 지브리가 일반인들의 사진을 ‘지브리풍’으로 바꿔주는 별도의 사업을 하고 있지 않았던 만큼 챗GPT를 대상으로 “너희들의 기술로 내가 피해를 봤다”는 주장이 성립하기도 어렵습니다.
다만 저작권으로는 인정받지 못할 수 있지만 특정 화풍이 널리 알려져 있고 소비자가 이를 브랜드처럼 인식한다면 트레이드 드레스로 보호받을 가능성도 있습니다. 트레이드 드레스는 상품의 전체적인 ‘외관’이나 ‘느낌’을 의미합니다. 애플 제품의 디자인이나 스타벅스의 인테리어처럼 소비자가 특정 브랜드와 연결 짓는 고유한 외형이 이에 해당합니다. 어떤 작가의 화풍이 독자적이고 널리 알려져 있다면 이를 트레이드 드레스로 주장할 여지가 있을 수 있습니다.
전문가들은 이 같은 ‘모호한 영역’이 향후 법정에서 어떻게 해석되는가에 따라 AI 이미지 산업의 방향도 달라질 수 있다고 이야기합니다. 이미 글로벌 AI 기업을 상대로 한 저작권 관련 소송도 여럿 진행 중입니다. 작가 안데르센은 2023년 이미지 생성 AI 기업 ‘스테빌리티 AI’를 상대로 소송을 제기했습니다. 자신의 이름만으로도 화풍이 재현됐다는 이유에서입니다. 게티이미지는 자사 워터마크가 포함된 이미지가 AI 생성물에서 발견되자 스테빌리티 AI를 상대로 17억 달러 규모의 손해배상 소송을 제기하기도 했습니다. 소송은 현재 진행 중입니다.
AI 이미지가 원작과 ‘실질적 유사성’을 갖는 경우에만 저작권 침해로 인정되는데 수백만 장의 이미지가 무단으로 학습됐는지 확인하기란 쉽지 않습니다. 이에 따라 ‘AI 학습의 투명성 확보’가 향후 핵심 쟁점으로 떠오를 전망입니다. 챗GPT의 이미지 생성 기술은 ‘누구나 사용할 수 있는 시대’를 앞당겼습니다. 누구나 휴대전화에서 AI에 그림을 그려달라고 명령하는 시대가 됐습니다. 그러나 기술의 발전은 새로운 책임도 동반합니다. 누구의 작품을 어디까지 따라 할 수 있을까요? AI 시대의 창작과 표절의 경계는 여전히 흐릿합니다.
원호섭
과학이 좋아 마블 영화를 챙겨보는 공대 졸업한 기자.
‘과학 그거 어디에 써먹나요’
‘10대가 알아야 할 미래기술10’ 등을 썼다.

