3초만에 이미지 뚝딱···카카오브레인 '칼로 2.0' 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
카카오브레인이 사실감 넘치는 이미지를 3초 안에 그려내는 초거대 AI 이미지 생성 모델 '칼로(Karlo) 2.0'을 10일 공개했다.
김일두 카카오브레인 각자 대표는 "인체 비율 및 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다"며 "많은 데이터와 사용자 피드백을 학습시켜 실사 수준의 이미지를 생성하는 동시에 보다 다양한 사용자의 니즈를 반영할 수 있는 이미지 생성 모델로 발전시켜 나갈 것"이라고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
최대 해상도 2048x2048 지원
카카오브레인이 사실감 넘치는 이미지를 3초 안에 그려내는 초거대 AI 이미지 생성 모델 ‘칼로(Karlo) 2.0’을 10일 공개했다.
칼로 2.0은 약 3억 장 규모의 텍스트-이미지 데이터셋을 학습했다. 칼로 2.0이 그린 이미지의 해상도는 최대 2048x2048을 지원하며 이미지 상의 공간감, 입체감, 동물의 털과 같은 텍스처를 디테일하게 표현하는 세밀함 등이 보강돼 실사에 가까운 고품질 이미지 생성이 가능하다. ‘모던 아티스트’ 등을 포함한 각종 화풍 구현 능력도 뛰어나며, 이미지 생성 속도 역시 기존 모델 칼로 1.4 대비 단축돼 3초 만에 사용자가 원하는 이미지를 만들어낼 수 있다. 카카오브레인 관계자는 "글로벌 톱 티어 수준의 언어 이해력을 기반으로 완성도 높은 그림을 생성할 수 있는 성능을 갖췄다"며 "'밝은 파란 눈동자를 가진 고양이'와 같은 복잡한 프롬프트(명령어)를 입력해도 이를 명확히 이해하고 그려낼 수 있다"고 말했다.
카카오브레인은 칼로 2.0 오픈 API(응용프로그램 인터페이스)를 개발자 커뮤니티인 '카카오디벨로퍼스'에 공개했다. 국내 AI 생태계 발전을 위해서다. 칼로 2.0은 기존 칼로 1.4에 비해 다양한 크기 및 비율의 이미지 생성이 가능하며, 높은 프롬프트 이해도와 더불어 ‘부정 명령어’ 기능을 통해 이미지 생성 시 제외해야 하는 표현이나 키워드를 사전에 제어한다. 카카오브레인은 칼로 2.0 오픈 API를 선보이면서, 최대 500장까지 가능했던 무료 생성 이미지 수를 월 최대 60만 장까지 대폭 확대했다.
김일두 카카오브레인 각자 대표는 “인체 비율 및 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다”며 “많은 데이터와 사용자 피드백을 학습시켜 실사 수준의 이미지를 생성하는 동시에 보다 다양한 사용자의 니즈를 반영할 수 있는 이미지 생성 모델로 발전시켜 나갈 것”이라고 말했다.
김성태 기자 kim@sedaily.comCopyright © 서울경제. 무단전재 및 재배포 금지.
- '선정 퍼포먼스 논란' 마마무 화사 공연음란죄 고발당해
- '만수르 밑에서 일한다'…'과학계 퇴출' 황우석 전한 근황 '깜짝'
- 압구정 '미니 신도시'급으로 탈바꿈한다[집슐랭]
- 파전·라면 4만원에 맥주도 한종류뿐…'다신 안와'
- '18살 되면 무조건 2800만원씩'…'기본상속' 공약 나온 '이 나라'
- '아버지 천국에서 만나요'…'차인표父' 차수웅 전 우성해운 회장 별세
- “아저씨랑 데이트하자”…‘잔액부족’ 뜬 20살女 유사강간한 택시기사
- '사람 죽이러 간다'…부산역 발칵 뒤집은 '허위 신고' 사건의 전말
- 尹 지지율, 3주간 상승세 멈추고 다시 30%대…2.9%p 내린 39.1%[리얼미터]
- '마동석이 왜 여기에?'…이름만 바꿔 '티비몬'으로 또 나타난 누누티비