“제시어 입력 시 이미지 생성”…카카오브레인, ‘칼로’ API 공개

민단비 2023. 1. 9. 10:01
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

초거대 인공지능(AI) 기술을 활용해 세상에 단 하나뿐인 이미지를 손쉽게 생성하고 편집, 변환할 수 있게 됐다.

김일두 카카오브레인 대표는 "이번에 공개한 칼로 API 및 체험판을 통해 더 많은 사람들이 카카오브레인의 혁신적인 AI 이미지 생성 기술을 접할 수 있기를 바란다"며 "카카오브레인은 꾸준한 연구개발을 통해 칼로의 성능을 고도화하고 이를 다양한 형태로 공개하며 활용 범위를 꾸준히 확대할 것"이라고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

데이터셋 확장 학습과 편집·변환 기능 추가한 AI 이미지 모델
무료 사용 가능한 체험판도 제공
이미지 아웃페인팅 등 기능 추가로 성능 고도화 계획
‘칼로(Karlo)’로 생성한 토끼 이미지. ⓒ카카오

초거대 인공지능(AI) 기술을 활용해 세상에 단 하나뿐인 이미지를 손쉽게 생성하고 편집, 변환할 수 있게 됐다.


카카오브레인은 개발자 전용 웹사이트 ‘카카오디벨로퍼스’에서 카카오브레인의 한층 더 발전된 AI 이미지 모델 ‘칼로(Karlo)’를 응용프로그램 인터페이스(API)로 공개했다고 9일 밝혔다.


카카오디벨로퍼스는 웹 서비스, 모바일 앱, 기타 응용 프로그램 개발에 필요한 플랫폼 및 카카오의 다양한 서비스와 연계할 수 있는 부가 기능을 제공하는 개발자 전용 웹사이트다. 카카오의 AI 기술, 카카오톡 접점이 필요한 파트너나 개인 누구나 사용 가능하며 카카오 기술 혹은 무료 제공하는 오픈 API를 활용해 AI 서비스를 만들 수 있다.


‘칼로 API’는 1억8000장 규모로 확장된 텍스트-이미지 데이터셋을 학습해, 이용자가 입력한 제시어의 내용을 이해한 후 다양한 화풍과 스타일로 세상에 단 하나뿐인 이미지를 생성하는 툴이다. 특히 생성한 이미지를 이용자의 의도에 따라 편집 및 변환하는 기능을 추가해 툴의 활용도를 높였다.


고도의 창의력을 요하는 크리에이터, 디자이너, 예술 작가 등 창작 작업에 칼로 API를 다양하게 활용할 수 있다.


예를 들어 크리에이터가 “유화로 그린 검은 토끼”라는 제시어를 입력하면 칼로가 제시어의 맥락을 이해하고 검은 토끼의 이미지를 유화 화풍으로 상상하여 그려낸다.


토끼 얼굴 영역을 선택하고 “왕관을 쓴 검은 토끼”라는 제시어를 추가 입력하면 해당 영역을 칼로가 편집해 화풍은 유지한 채 왕관을 쓴 검은 토끼 이미지로 재생성할 수도 있다.


신규 브랜드 로고나 포스터 디자인 또는 새로운 작품을 만들어내야 할 때 영감을 얻는 도구로도 활용 가능하다.


예를 들어 작가가 생각하는 작품의 핵심 주제와 연관성이 높은 이미지를 업로드하면 칼로가 이를 기반으로 다양한 이미지를 생성한다. 이를 통해 작가는 아이디어를 얻어 독창적인 작품을 만들 수 있다.


카카오브레인은 누구나 쉽게 칼로 API를 이용할 수 있는 체험판을 함께 공개했다. 매달 제공되는 이용 횟수 안에서 칼로의 다양한 기능을 사용할 수 있으며, 1회 당 최대 3장의 이미지를 생성·편집·변환할 수 있다. 추가 제휴 시 유료 API도 사용 가능하다.


카카오브레인은 향후 추가적인 데이터셋 학습과 함께, 기존 이미지를 보고 빛과 그림자, 주변 사물 등을 상상해 이미지를 확장할 수 있는 ‘이미지 아웃페인팅’ 등 다양한 기능을 추가하며 모델의 성능을 지속 고도화해 나갈 계획이다.


김일두 카카오브레인 대표는 “이번에 공개한 칼로 API 및 체험판을 통해 더 많은 사람들이 카카오브레인의 혁신적인 AI 이미지 생성 기술을 접할 수 있기를 바란다”며 “카카오브레인은 꾸준한 연구개발을 통해 칼로의 성능을 고도화하고 이를 다양한 형태로 공개하며 활용 범위를 꾸준히 확대할 것”이라고 말했다.

Copyright © 데일리안. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?