카카오브레인, 이미지 만들어주는 AI `칼로 2.0` 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
카카오브레인이 사실감 넘치는 이미지를 3초 안에 그려내는 초거대 AI(인공지능) 이미지 생성 모델 '칼로(Karlo) 2.0'을 공개했다.
김일두 카카오브레인 각자대표는 "인체 비율과 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다"며 "많은 데이터와 사용자 피드백을 학습시켜 실사 수준의 이미지를 생성하는 동시에 보다 다양한 사용자의 니즈를 반영할 수 있는 이미지 생성 모델로 발전시켜 나갈 것"이라고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
카카오브레인이 사실감 넘치는 이미지를 3초 안에 그려내는 초거대 AI(인공지능) 이미지 생성 모델 '칼로(Karlo) 2.0'을 공개했다.
칼로 2.0은 약 3억장의 텍스트·이미지 데이터셋을 학습해 글로벌 선두급 수준의 언어 이해력을 기반으로 완성도 높은 그림을 생성해 준다는 게 카카오브레인 측의 설명이다. 예를 들어 '밝은 파란 눈동자를 가진 고양이(A cat has light blue eyes)'와 같은 복잡한 프롬프트(명령어)를 입력해도 명확히 이해해 그려낼 수 있다.
'칼로 2.0'의 해상도는 최대 2048×2048을 지원한다. 해상도가 높을수록 다양한 사이즈로 작업 가능하므로 사용자가 표현하고자 하는 이미지를 보다 심도 있고 섬세하게 그려낼 수 있다. 이미지 상 공간감·입체감과 동물의 털과 같은 텍스처를 디테일하게 표현하는 세밀함도 보강됐다. '모던 아티스트' 등을 포함한 각종 화풍 구현 능력을 갖췄으며, 이미지 생성 속도도 기존 모델 칼로 1.4보다 빨라져 3초 만에 원하는 이미지를 생성할 수 있다.
카카오브레인은 국내 AI생태계 발전을 위해 기존 칼로1.4 모델로 제공하던 오픈 API(응용프로그램 인터페이스)를 칼로 2.0 모델로 업그레이드해 카카오디벨로퍼스를 통해 공개했다. 칼로 2.0은 높은 프롬프트 이해도와 더불어 부정 명령어(Negative Prompt) 기능을 통해 이미지 생성 시 제외해야 하는 표현이나 키워드를 사전에 제어한다. 최대 500장까지 가능했던 무료 생성 이미지 수도 월 최대 60만 장까지 크게 늘렸다.
김일두 카카오브레인 각자대표는 "인체 비율과 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다"며 "많은 데이터와 사용자 피드백을 학습시켜 실사 수준의 이미지를 생성하는 동시에 보다 다양한 사용자의 니즈를 반영할 수 있는 이미지 생성 모델로 발전시켜 나갈 것"이라고 말했다.
팽동현기자 dhp@
Copyright © 디지털타임스. 무단전재 및 재배포 금지.
- “남친에 성폭행 당했다”…30대女 허위 신고, 전과는 안 남는다
- 또 터진 ‘주차 빌런’…이번엔 테슬라도 2칸 주차
- ‘前 남편 필라테스 먹튀’ 노예슬씨, 놀라운 근황…“이혼 後 좋은 분 만나”
- 주차문제로 30대女 폭행 갈비뼈 골절…`근육맨` 전직 보디빌더 구속영장
- `킥보드 콕 흠집` 4000만원 요구 포르쉐…"글 내리면 1000만원"
- 韓 "여야의정 제안 뒤집고 가상자산 뜬금 과세… 민주당 관성적 반대냐"
- [트럼프 2기 시동] 트럼프, 김정은과 협상할까… "트럼프 일방적 양보 안 할 것"
- 내년 세계성장률 3.2→3.0%… `트럼피즘` 美 0.4%p 상승
- `범현대 3세` 정기선 수석부회장, HD현대 방향성 주도한다
- "AI전환과 글로벌경쟁 가속… 힘 합쳐 도약 이뤄야"