그림 하나 ‘만들어’ 드릴까요?…딱 3초만 기다려주세요

고민서 기자(esms46@mk.co.kr) 2023. 7. 11. 05:54
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

3초 만에 실사 같은 이미지
카카오브레인, 칼로 2.0 공개
초거대 AI 이미지 생성 모델
카카오디벨로퍼스에 API 공개
칼로 1.4모델 활용 이미지와 2.0모델 활용 이미지 비교 [사진 제공 = 카카오브레인]
카카오의 인공지능(AI) 전문 자회사 카카오브레인은 10일 사실감 넘치는 이미지를 3초 안에 그려내는 초거대 AI 이미지 생성 모델 ‘칼로(Karlo) 2.0’을 출시했다고 밝혔다.

칼로 2.0은 약 3억장 규모의 텍스트·이미지 데이터셋을 학습한 초거대 AI 모델이다. 국내에서 자체 모델에 기반해 이미지 생성 AI를 서비스하는 회사는 카카오브레인이 유일하다.

칼로 2.0은 글로벌 최고 수준의 언어 이해력을 기반으로 완성도 높은 그림을 생성할 수 있는 성능을 갖췄다게 회사측 설명이다. 가령 ‘밝고 파란 눈동자를 가진 고양이(A cat has light blue eyes)’와 같은 복잡한 명령어(프롬프트)를 입력해도 이를 명확히 이해하고 그려낼 수 있다는 것이다.

해상도는 최대 ‘2048x2048’을 지원한다. 회사 측은 “생성하는 이미지의 해상도가 높을수록 다양한 이미지 사이즈로 작업이 가능해 사용자는 표현하고자 하는 이미지를 보다 심도 있고 섬세하게 그려낼 수 있다”고 설명했다.

여기에 이미지 상의 공간감, 입체감, 동물의 털과 같은 질감(텍스처)을 표현하는 세밀함 등이 보강돼 실사에 가까운 고품질 이미지를 생성할 수 있다. 또 ‘모던 아티스트’ 등을 포함한 각종 화풍 구현 능력도 탁월하다고 카카오브레인은 소개했다. 이미지 생성 속도 역시 기존 모델인 ‘칼로 1.4’ 대비 단축돼 3초 만에 사용자가 원하는 이미지를 만들어낼 수 있다고 회사는 덧붙였다.

한편 카카오브레인은 국내 AI 생태계 발전을 위해 칼로 2.0의 API(응용프로그램 인터페이스)를 카카오디벨로퍼스에 공개했다. 특히 카카오브레인은 칼로 2.0 API를 내놓으면서 칼로 1.4에서 월 최대 500장까지 가능했던 무료 생성 이미지 수를 월 최대 60만장으로 대폭 확대했다.

카카오브레인은 스타트업이나 일반 개발자가 사용할 수 있는 무료 이미지 생성 횟수를 글로벌 최대 규모로 확대함으로써 칼로 기술을 활용한 다양한 가치 창출을 지원하겠다는 의지를 담았다고 설명했다.

김일두 카카오브레인 각자 대표는 “인체 비율과 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습과 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다”며 “많은 데이터와 사용자 피드백을 학습시켜 실사 수준의 이미지를 생성하는 동시에 보다 다양한 사용자의 수요를 반영할 수 있는 이미지 생성 모델로 발전시켜 나갈 것”이라고 말했다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?