"3초 만에 실사 같은 이미지 척척"…카카오브레인, 칼로 2.0 공개

정유림 2023. 7. 10. 09:41
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

카카오의 인공지능(AI) 사업을 추진하는 카카오브레인이 사실감 넘치는 이미지를 3초 안에 만들어내는 이미지 생성 AI 모델 '칼로(Karlo) 2.0'을 공개했다.

김일두 카카오브레인 각자 대표는 "인체 비율 및 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다"며 "보다 다양한 이용자의 수요(니즈)를 반영할 수 있는 이미지 생성 모델로 발전시켜 나갈 것"이라고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

약 3억장 규모 텍스트-이미지 데이터셋 학습…최대 2048x2048 해상도 지원
무료 이미지 생성 횟수 월 60만장 제공…"가치 창출 지원"

[아이뉴스24 정유림 기자] 카카오의 인공지능(AI) 사업을 추진하는 카카오브레인이 사실감 넘치는 이미지를 3초 안에 만들어내는 이미지 생성 AI 모델 '칼로(Karlo) 2.0'을 공개했다.

[사진=카카오브레인]

칼로 2.0은 기존 모델을 업그레이드한 것으로, 약 3억장 규모 텍스트-이미지 데이터셋을 학습한 AI 모델이다. '밝은 파란 눈동자를 가진 고양이(A cat has light blue eyes)'와 같이 복잡한 프롬프트(명령어)를 입력해도 이를 이해하고 그려낼 수 있다. 부정 명령어 기능을 통해 이미지 생성 시 제외해야 하는 표현이나 키워드를 사전에 제어할 수도 있다.

칼로 2.0은 해상도 최대 2048x2048을 지원한다. 생성하는 이미지의 해상도가 높을수록 다양한 사이즈(크기)로 작업할 수 있다. 이를 통해 이용자는 표현하고자 하는 이미지를 보다 심도 있고 섬세하게 그려낼 수 있다는 설명이다.

칼로 2.0은 이미지 상의 공간감, 입체감, 동물의 털과 같은 텍스처를 보다 정밀하게 표현하는 세밀함 등이 보강돼 실사에 가까운 고품질 이미지 생성이 가능하다. 각종 화풍을 구현할 수 있으며 이미지 생성 속도도 기존 모델인 칼로 1.4 대비 단축, 3초 만에 원하는 이미지를 만들어낼 수 있는 것이 특징이다.

카카오브레인은 국내 AI 생태계 발전을 위해 칼로 2.0 오픈 응용프로그램 인터페이스(API)를 카카오디벨로퍼스에 공개했다. 기존 칼로 1.4 모델로 제공하던 오픈 API를 칼로 2.0 모델로 업그레이드한 것.

카카오브레인은 칼로 2.0 오픈 API를 선보이면서 최대 500장까지 가능했던 무료 생성 이미지 수를 월 최대 60만장까지 대폭 확대했다. 일반 기업(스타트업) 또는 개발자가 사용할 수 있는 무료 이미지 생성 횟수를 확대해 다양한 가치 창출을 지원하겠다는 포부다.

김일두 카카오브레인 각자 대표는 "인체 비율 및 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다"며 "보다 다양한 이용자의 수요(니즈)를 반영할 수 있는 이미지 생성 모델로 발전시켜 나갈 것"이라고 말했다.

/정유림 기자(2yclever@inews24.com)

Copyright © 아이뉴스24. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?