구글 이미지AI ‘이마젠3’ 출시 “향상된 텍스트 이해, 세밀한 표현”

이상덕 기자(asiris27@mk.co.kr) 2024. 8. 18. 18:06
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

구글은 이미지 생성 모델의 최신 버전인 이마젠 3(Imagen 3)를 출시한다고 18일 밝혔다.

이날 구글은 블로그를 통해 "이마젠 3는 다양한 시각 스타일을 생성할 수 있는 능력이 크게 향상됐다"면서"긴 텍스트 설명에서도 작은 디테일까지 정확하게 표현할 수 있다"고 말했다.

아울러 이마젠 3는 포토리얼리즘에서부터 회화적 스타일, 클레이 애니메이션 장면까지 다양한 형식과 스타일의 이미지를 생성할 수 있다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

구글 이마젠3로 제작한 경복궁 디오라마
구글은 이미지 생성 모델의 최신 버전인 이마젠 3(Imagen 3)를 출시한다고 18일 밝혔다. 이마젠 3는 이전 모델들보다 세밀한 묘사를 할 수 있는 것이 특징이다. 아울러 이미지 생성 시 불필요한 노이즈를 줄였다는 평가다.

이날 구글은 블로그를 통해 “이마젠 3는 다양한 시각 스타일을 생성할 수 있는 능력이 크게 향상됐다”면서“긴 텍스트 설명에서도 작은 디테일까지 정확하게 표현할 수 있다”고 말했다. 이를 위해 이마젠 3는 다양한 유형의 작업에 최적화된 다양한 버전으로 제공된다. 간단한 스케치 생성부터 고해상도 이미지 생성까지 모두 가능하다.

특히 이마젠 3는 이미지FX(ImageFX)와 버텍스AI(Vertex AI)를 통해 사용할 수 있다. 사용자들이 쉽게 고품질의 이미지를 생성할 수 있도록 설계됐다는 것이 구글의 설명이다. 아울러 이마젠 3는 포토리얼리즘에서부터 회화적 스타일, 클레이 애니메이션 장면까지 다양한 형식과 스타일의 이미지를 생성할 수 있다.

구글은 “우리는 이마젠 3의 데이터에 보다 풍부한 디테일을 추가해 모델이 카메라 각도나 구도와 같은 세부적인 차이를 더 정확하게 학습할 수 있게 했다”고 밝혔다. 이로 인해 이마젠 3는 더 넓은 범위의 주제와 스타일을 정확하게 생성할 수 있게 됐다는 것이다.

또 이마젠 3는 텍스트 렌더링 기능이 크게 개선됐다. 스타일화된 생일 카드나 프레젠테이션 등 다양한 용도로 활용할 수 있다. 구글은 이마젠 3의 최신 기능들을 구글의 다양한 제품에 확대 적용할 계획이라고 밝혔다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?