3초 안에 사진 같은 그림 뚝딱…카카오, 두번째 이미지 AI 모델 공개

배한님 기자 2023. 7. 10. 10:06
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

카카오의 AI(인공지능) 자회사 카카오브레인이 10일 초거대 이미지 생성 AI 모델 '칼로(Karlo) 2.0'을 공개했다.

김일두 카카오브레인 각자 대표는 "인체 비율 및 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다"며 "많은 데이터와 사용자 피드백을 학습시켜 실사 수준의 이미지를 생성하는 동시에 보다 다양한 사용자의 니즈를 반영할 수 있는 이미지 생성 모델로 발전시켜 나갈 것"이라고 전했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

'칼로 2.0' 카카오디벨로퍼스에 API 공개…월 60만장 무료 생성 가능
3억장 규모 텍스트-이미지 데이터셋 학습…최대 2048X2046 해상도 지원
기존 이미지 생성 AI 모델인 칼로 1.4와 신규 모델인 칼로 2.0 비교. /사진=카카오브레인


카카오의 AI(인공지능) 자회사 카카오브레인이 10일 초거대 이미지 생성 AI 모델 '칼로(Karlo) 2.0'을 공개했다. 지난해 12월 칼로 1.0을 선보인 지 약 반년만이다. 1억2000만장이었던 데이터셋 규모는 3배에 가까운 3억장까지 늘었고, 생성 시간도 기존 모델 대비 절반 수준인 3초로 줄었다. 최대 지원 해상도는 2048X2048이다.

카카오브레인 관계자는 "글로벌 탑 티어 수준의 언어 이해력을 기반으로 완성도 높은 그림을 생성할 수 있다"며 "예를 들어 '밝은 파란 눈동자를 가진 고양이 (A cat has light blue eyes)'와 같은 복잡한 프롬프트(명령어)도 명확히 이해하고 그려낼 수 있다"고 설명했다. 그는 이어 "이미지상의 공간감·입체감·동물의 털과 같은 질감을 디테일하게 표현하는 세밀함 등이 보강돼 실사에 가까운 고품질 이미지 생성이 가능하다"고 강조했다.

카카오브레인은 국내 AI 생태계 발전을 위해 칼로 2.0 API(응용프로그램 인터페이스)를 카카오 개발자 페이지인 카카오디벨로퍼스에 공개했다. 기존에 제공하던 칼로 1.4를 칼로 2.0으로 업그레이드한 것. 칼로 모델을 업데이트하면서 월 무료 생성 이미지 수도 최대 500장에서 60만장까지 대폭 확대했다. 카카오 관계자는 "무료 이미지 생성 횟수를 글로벌 최대 규모로 확대함으로써 칼로 기술을 활용한 다양한 가치 창출을 지원하겠다는 의지를 담았다"며 "기존 칼로 모델로 서비스하던 '비 에디트(B^EDIT)' 등도 곧 칼로 2.0으로 모델을 업그레이드할 예정"이라고 했다.

김일두 카카오브레인 각자 대표는 "인체 비율 및 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다"며 "많은 데이터와 사용자 피드백을 학습시켜 실사 수준의 이미지를 생성하는 동시에 보다 다양한 사용자의 니즈를 반영할 수 있는 이미지 생성 모델로 발전시켜 나갈 것"이라고 전했다.

배한님 기자 bhn25@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?