챗GPT ‘이미지 생성’ 상업용으로 확장

오픈AI가 기존 단점을 대폭 보완한 이미지 생성·편집 도구 ‘챗GPT 이미지 1.5’를 선보였다. 이미지 생성 도구를 둘러싼 구글 등 글로벌 빅테크의 경쟁이 날로 뜨거워지는 모습이다.
16일(현지시간) 출시된 챗GPT 이미지 1.5의 가장 큰 특징은 조명이나 구도, 인물 외형 같은 핵심 요소는 그대로 유지하면서 세부 사항을 정밀하게 수정할 수 있다는 점이다.
기존에는 이미지 속 특정 부분만 고치려 하면 인공지능(AI)이 전체 이미지를 다시 생성해야 했다. 그러다 보니 정교한 통제가 안 돼 원하는 이미지를 얻지 못하는 경우가 많았다.
새 버전은 이용자의 지시(프롬프트)를 해석하는 능력이 높아져 개별 요소의 ‘미세 조정’이 가능하다. 예를 들어 스케이트보드를 타는 남성(사진)의 이미지를 준 뒤 남성의 티셔츠와 모자 색깔만 바꿔 달라고 요청하면 나머지 요소는 건드리지 않은 채 지정된 부분만 수정해내는 식이다.
이미지 생성 속도는 이전 모델보다 최대 4배 빨라졌으며, 약점이었던 텍스트 처리 능력도 크게 향상됐다. 기존에는 이미지 속 글자를 제대로 구현해내지 못하는 사례가 빈번했다.
오픈AI 측은 이 같은 개선이 “그래픽·로고 제작과 같은 마케팅·브랜딩 작업, 다양한 제품 이미지 카탈로그를 생성해야 하는 전자상거래에 특히 적합하다”며 “이전 버전 대비 이미지 입력·출력 비용이 20% 더 저렴해 같은 예산으로 더 많은 이미지를 생성 및 반복 작업할 수 있다”고 설명했다.
일명 ‘지브리풍 이미지’가 놀이에 그쳤다면, 이젠 업무나 상업적 목적으로 활용될 수준에 이르렀음을 강조한 것이다.
오픈AI의 챗GPT 이미지 1.5 출시는 구글의 이미지 생성·편집 도구 ‘나노 바나나 프로’ 출시 26일 만이다. ‘포토샵이 필요 없다’는 평가를 받는 나노 바나나 프로가 오픈AI에 긴장감을 불어넣었다고 평가된다. 미국 정보기술(IT) 전문매체 테크크런치는 “오픈AI는 이미지 1.5를 1월 초 공개할 계획이었으나 일정을 앞당겼다”고 전했다.
글로벌 AI 업계의 이미지·영상 생성 도구 경쟁은 격화 중이다. 이날 중국의 알리바바 역시 비주얼 생성 모델 완(Wan)의 최신 버전인 ‘완 2.6’을 공개하며 경쟁에 가세했다.
최민지 기자 ming@kyunghyang.com
Copyright © 경향신문. 무단전재 및 재배포 금지.
- “이란, 세계 경제 안보에 타격”···40여개국 외교장관들 ‘호르무즈 개방’ 논의, 한국도 참석
- ‘전쟁 지원 퇴짜’ 뒤끝···트럼프 “아내에게 학대당하는 마크롱” 조롱 발언
- 이 대통령, 장동혁에 “왜 빨간 거 안 매셨어요?” 넥타이 농담…장 대표는 연설 중 퇴장
- “전쟁 난다고 쓰레기 싸들고 갈 건가요” 파는 사람·사는 사람 모두 불행한 ‘쓰봉 사재기’
- ‘음료 3잔 횡령 혐의’ 알바생 고소한 카페 점주, 결국 소 취하···수사는 절차대로
- 반세기 전엔 미국 백인 남성뿐이었지만…이번엔 ‘다양성’ 품었다
- 한국 LNG 수입 비중 1위 호주, 천연가스 수출 제한한다···자원 부국 ‘에너지 빗장’ 신호탄
- “적이 실수할 땐 방해 마라” 트럼프 뒤 시진핑의 미소···이코노미스트가 분석한 ‘중국 불개
- 호르무즈 해협에 묶인 원유 1800만t···‘환경 재앙’ 경고 수위 높아진다
- ‘대선 예비후보 명함’ 돌린 김문수…검찰, 벌금 100만원 구형