한층 정교해진 챗GPT, 이미지 생성 AI 모델 출시
조슬기 기자 2025. 3. 26. 04:45
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
텍스트와 이미지 첫 결합 모델…이용자 의도 파악해 생성
챗GPT 개발사 오픈AI가 한층 진화한 새로운 이미지 생성 인공지능(AI) 모델을 내놨습니다.
오픈AI는 현지시각 25일부터 '챗GPT-4o(포오) 이미지 생성(ChatGPT-4o Image Generation)' 모델을 출시한다고 밝혔습니다.
새로운 모델은 오픈AI의 대표적 멀티모달 AI 모델인 챗GPT-4o와 결합한 이미지 생성 모델로, 텍스트와 이미지를 통합한 첫 모델이라고 오픈AI는 설명했습니다.
오픈AI의 멀티모달 담당인 가브리엘 고는 "텍스트에 대한 지능을 가진 GPT-4의 강점과 최고의 이미지 생성 모델의 시각적 지능을 결합한 모델을 만들고자 했다"며 "이번 모델이 바로 그 목표를 달성한 결과물"이라고 말했습니다.
이어 새 모델이 이미지를 생성한다는 점에서 기존 '달리(DALL-E)'의 업그레이드 버전이긴 하지만, 두 모델의 기반 기술이 완전히 다르고 새 모델에서 다양한 개선이 이뤄졌다고 설명했습니다.
기존에는 이용자가 원하는 이미지를 위해 프롬프트를 하나하나 입력해야 했지만, 새 모델은 이용자의 의도를 파악해 이미지를 생성한다는 설명입니다.
예를 들어 기존 AI 이미지 생성 모델들은 단순히 자전거 이미지는 잘 생성하지만 '삼각형 바퀴를 가진 자전거'를 그려달라고 하면 어려움을 겪었던 데 반해 새 모델은 복잡한 요청도 쉽게 수행합니다.
특히, 텍스트를 이미지에 정확히 삽입하는 기능이 크게 개선됐다는 게 오픈AI 측의 설명입니다. '여러 종류의 고래를 보여주는 포스터를 만들어 줘'라고 요청하면 고래의 종류와 이름을 정확히 매칭해 생성하는 식입니다.
기존 모델은 이런 객체 속성 관계를 잘 이해하지 못하고 글씨는 종종 깨지는 경우가 많았지만, 새 모델은 훨씬 더 복잡한 지시도 잘 수행하는 것으로 평가됐습니다.
무지개를 정의하는 '뉴턴의 프리즘 실험'에 관한 이미지를 간단한 설명과 함께 생성해달라고 하면 문구가 들어간 이미지가 한눈에 보기 쉽게 생성하는 등 자연법칙에 관한 이미지도 쉽게 만들어내는 것으로 전해졌습니다.
이밖에도 만화를 그려달라고 하면 대화가 들어간 카툰이 깔끔하게 생성되고, 메뉴판이나 수학 공식을 그려달라고 하면 한눈에 보기 쉽게 생성할 수 있습니다.
오픈AI 측은 새 모델이 또 한국어로도 이미지 생성이 가능하며 이날부터 챗GPT 프로 등 유료 가입자는 물론, 무료 가입자도 사용할 수 있다고 전했습니다.
오픈AI 새 이미지 모델이 생성한 '뉴턴의 프리즘 실험'
[샌프란시스코=연합뉴스. 오픈AI 제공]
[샌프란시스코=연합뉴스. 오픈AI 제공]
챗GPT 개발사 오픈AI가 한층 진화한 새로운 이미지 생성 인공지능(AI) 모델을 내놨습니다.
오픈AI는 현지시각 25일부터 '챗GPT-4o(포오) 이미지 생성(ChatGPT-4o Image Generation)' 모델을 출시한다고 밝혔습니다.
새로운 모델은 오픈AI의 대표적 멀티모달 AI 모델인 챗GPT-4o와 결합한 이미지 생성 모델로, 텍스트와 이미지를 통합한 첫 모델이라고 오픈AI는 설명했습니다.
오픈AI의 멀티모달 담당인 가브리엘 고는 "텍스트에 대한 지능을 가진 GPT-4의 강점과 최고의 이미지 생성 모델의 시각적 지능을 결합한 모델을 만들고자 했다"며 "이번 모델이 바로 그 목표를 달성한 결과물"이라고 말했습니다.
이어 새 모델이 이미지를 생성한다는 점에서 기존 '달리(DALL-E)'의 업그레이드 버전이긴 하지만, 두 모델의 기반 기술이 완전히 다르고 새 모델에서 다양한 개선이 이뤄졌다고 설명했습니다.
기존에는 이용자가 원하는 이미지를 위해 프롬프트를 하나하나 입력해야 했지만, 새 모델은 이용자의 의도를 파악해 이미지를 생성한다는 설명입니다.
예를 들어 기존 AI 이미지 생성 모델들은 단순히 자전거 이미지는 잘 생성하지만 '삼각형 바퀴를 가진 자전거'를 그려달라고 하면 어려움을 겪었던 데 반해 새 모델은 복잡한 요청도 쉽게 수행합니다.
특히, 텍스트를 이미지에 정확히 삽입하는 기능이 크게 개선됐다는 게 오픈AI 측의 설명입니다. '여러 종류의 고래를 보여주는 포스터를 만들어 줘'라고 요청하면 고래의 종류와 이름을 정확히 매칭해 생성하는 식입니다.
기존 모델은 이런 객체 속성 관계를 잘 이해하지 못하고 글씨는 종종 깨지는 경우가 많았지만, 새 모델은 훨씬 더 복잡한 지시도 잘 수행하는 것으로 평가됐습니다.
무지개를 정의하는 '뉴턴의 프리즘 실험'에 관한 이미지를 간단한 설명과 함께 생성해달라고 하면 문구가 들어간 이미지가 한눈에 보기 쉽게 생성하는 등 자연법칙에 관한 이미지도 쉽게 만들어내는 것으로 전해졌습니다.
이밖에도 만화를 그려달라고 하면 대화가 들어간 카툰이 깔끔하게 생성되고, 메뉴판이나 수학 공식을 그려달라고 하면 한눈에 보기 쉽게 생성할 수 있습니다.
오픈AI 측은 새 모델이 또 한국어로도 이미지 생성이 가능하며 이날부터 챗GPT 프로 등 유료 가입자는 물론, 무료 가입자도 사용할 수 있다고 전했습니다.
당신의 제보가 뉴스로 만들어집니다.SBS Biz는 여러분의 제보를 기다리고 있습니다.홈페이지 = https://url.kr/9pghjn
저작권자 SBS미디어넷 & SBSi 무단전재-재배포 금지
Copyright © SBS Biz. 무단전재 및 재배포 금지.
SBS Biz에서 직접 확인하세요. 해당 언론사로 이동합니다.
- 한종희 삼성전자 부회장, 심장마비로 별세
- 기업은행 900억 부당대출…감추고 미루고 지웠다
- KTX 푯값도 오른다…공공요금 인상 행렬에 서민 부담 가중
- 유학비 등골 휘는데…환율 1470원 넘어 1500원 '위협'
- 첫 테이프 끊은 현대차…삼성·LG 등 다른 기업은?
- [단독] 새마을금고 무더기 '부실' 후폭풍…고금리 예금 막혔다
- [단독] 발란, 정산 지연에 진화 작업까지…입점사는 좌불안석
- '부당 내부거래 의혹' MBK·홈플러스·롯데카드 현장조사
- 계엄에 관세까지 '비관'…소비심리 다시 꺾였다
- [단독] 기업은행 'CEO 제재 1호' 가능성 열려 있다