‘덕테이프’의 정체는 오픈AI 신모델… “글자 새기고 캐릭터 복제까지”

김영욱 2026. 4. 22. 04:29
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI) 업계에서 정체를 숨긴 채 '덕테이프(Duct Tape)'라는 코드명으로 화제를 모았던 이미지 생성 도구가 마침내 베일을 벗었다.

오픈AI는 지난 21일(현지시간) 이미지 생성 능력을 획기적으로 개선한 '챗GPT 이미지 2.0'을 전격 공개하며 그 실체를 드러냈다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

베일 벗은 ‘덕테이프’, 정체는 오픈AI의 차세대 이미지 비서
“오타 지우고 일관성 더했다”… 시각 지능 갖춘 ‘이미지 2.0’의 진화
동영상 접고 이미지 집중한 오픈AI, “궁극의 개인 비서 구현이 목표”
무료 계정까지 전면 개방… 유료 모델은 ‘사고·프로’로 차별화
나노 바나나, GPT-1.5 이미지 모델, 덕트 테이프 모델 성능 비교표. 제미나이로 생성한 이미지.


인공지능(AI) 업계에서 정체를 숨긴 채 ‘덕테이프(Duct Tape)’라는 코드명으로 화제를 모았던 이미지 생성 도구가 마침내 베일을 벗었다. 오픈AI는 지난 21일(현지시간) 이미지 생성 능력을 획기적으로 개선한 ‘챗GPT 이미지 2.0’을 전격 공개하며 그 실체를 드러냈다.

이번에 출시된 서비스는 ‘이미지젠(ImageGen) 2.0’ 모델을 뿌리에 두고 있다. 앞서 AI 성능 비교 플랫폼인 ‘아레나’에서 테스트를 거칠 당시 기존 모델들의 고질적 약점이었던 오타 문제를 완벽히 극복하며 이용자들로부터 큰 기대를 모은 바 있다. 오픈AI 측은 “이 모델은 단순한 유희용을 넘어 시각적 지능을 확보했다”며 “특히 텍스트 구현 능력에서 전작과는 비교할 수 없는 진전을 이뤄냈다”고 밝혔다.

실제로 이 모델은 전문적인 디자인 역량이 강화되어 인포그래픽 등 복잡한 시각 정보를 표현하는 데 탁월한 성능을 보인다. 오픈AI는 이러한 강점을 바탕으로 해당 도구가 교육 및 연구 현장에서 필수적인 도구로 자리 잡을 것으로 기대하고 있다.

함께 공개된 ‘사고(Thinking)’ 및 ‘프로(Pro)’ 모델은 이미지 생성 과정에 추론 기능을 더한 것이 특징이다. ‘사고의 연쇄’ 기법을 적용해 사용자의 의도를 보다 정밀하게 반영하며, 특히 웹툰이나 만화처럼 여러 장의 이미지를 만들 때 등장인물의 외형을 일정하게 유지하는 ‘캐릭터 일관성’ 문제를 해결했다.

주목할 점은 최근 오픈AI가 동영상 생성 도구인 ‘소라(Sora)’ 사업을 중단하겠다고 선언한 직후 이번 발표가 나왔다는 점이다. 이에 대해 오픈AI 관계자는 “챗GPT가 궁극적인 개인 비서로 진화하기 위해 이미지 생성 기능은 필수적인 요소지만, 동영상에 대한 시장 수요는 아직 그 단계에 이르지 못했다”고 사업 전략 수정의 배경을 설명했다.

AI 생성물의 악용 가능성에 대해서도 철저한 대비책을 내놨다. 오픈AI는 “사용자 모니터링은 물론 생성 콘텐츠가 사회에 미치는 영향을 매우 신중하게 관리하고 있다”고 강조했다. 이를 위해 구글의 디지털 워터마크 기술인 ‘신스ID(SynthID)’를 도입, 육안으로는 식별이 어려워도 시스템상으로는 AI 저작물임을 즉시 확인할 수 있도록 조치했다.

이번 공개는 공교롭게도 세계적인 그래픽 소프트웨어 기업 어도비(Adobe)의 연례 행사인 ‘어도비 서밋’ 기간에 맞춰 이뤄졌다. AI 모델의 급격한 발전으로 인한 시장 잠식 우려에 대해 사힐 굽타 어도비 수석 총괄은 “고객들은 용도에 따라 각기 다른 모델을 선택해 사용한다”며 직접적인 경쟁 구도에 선을 그었다.

한편, 챗GPT 이미지 2.0은 무료 사용자를 포함한 전 세계 모든 이용자에게 순차적으로 배포된다. 다만 고도의 추론 능력이 필요한 사고 및 프로 모델은 월 20달러에서 200달러 사이의 유료 구독자들에게 한정해 제공될 예정이다.

김영욱 기자 wook95@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.