카카오, 이미지와 텍스트 모두 입력가능한 생성형AI ‘허니비’ 공개
카카오브레인이 이미지와 대규모 언어모델을 연결할 수 있는 멀티모달 언어모델(Multimodal Large Language Model· MLLM) ‘허니비(Honeybee)’를 공개했다. 기존 언어 중심의 명령어 입력을 이미지까지 확대한 것이 대표적인 특징이다.
카카오브레인은 19일 허니비의 오픈소스를 오픈소스 코드 공유 플랫폼인 깃허브에 공개했다고 밝혔다. 카카오브레인 관계자는 “현재 MLLM에 대한 연구는 공개된 모델의 수가 적고, 학습 방법 역시 자세히 공개되지 않아 개발이 어려운 상황”이라며 “MLLM의 발전에 기여하고자 자체 개발한 ‘허니비’의 소스코드를 공개하기로 결정했다”고 했다.
MLLM은 이미지와 명령어(프롬프트)를 입력하면, 언어로 답변하는 모델이다. 언어로만 입력과 출력을 하는 대규모 언어모델(Large Language Model)에서 확장된 형태라고 할 수 있다. MLLM은 이미지와 텍스트를 모두 입력할 수 있기 때문에 이미지에 담긴 장면을 묘사하거나 이미지와 텍스트가 혼합된 콘텐츠에 관한 질문을 이해하고 답변할 수 있다. 예를 들어 ‘허니비’에 ‘농구 경기 중인 두 명의 선수’ 이미지와 함께 ‘왼쪽 선수는 몇 번 우승했나요?’라는 질문을 입력하면, ‘허니비’가 입력된 이미지 내용과 질문을 함께 이해하고 답을 내놓는다.
한편 정신아 카카오 대표 내정자는 허니비를 이날 과학기술정보통신부가 연 ‘제5차 AI 최고위 전략대화’에서 정부 관계자들에게 선보였다. AI 최고위 전략대화는 국가 AI 경쟁력을 강화하려는 목적으로 민·관이 모여 정책·투자방향 등을 논의하는 협의체다.
Copyright © 조선일보. 무단전재 및 재배포 금지.
- 중앙지검, 명태균 관련 ‘尹대통령 부부 고발’ 창원지검 이송
- 주말 한파주의보급 추위…다음주까지 초겨울 추위 이어져
- [속보] 尹 대통령-시진핑, 페루서 2년만에 정상회담
- ‘북한강 시신 유기’ 양광준 동문 “동상 걸린 후배 챙겨주던 사람…경악”
- 권익위 “尹정부 전반기 26만명 집단 민원 해결”
- 수험표 배달에 수험생 수송까지...“콜택시냐” 경찰 내부 불만 나왔다
- Trump team plans to end EV tax credit, potentially hurting Korean automakers
- ‘해리스 지지’ 유명 배우 “미국 디스토피아, 떠나겠다”
- 내년 아파트 공시가격도 시세 변동만 반영...현실화율 69% 동결
- 野 ‘이재명 무죄’ 법원 총집결에... 한동훈 “뻔뻔함 수준 넘어, 나라 망가뜨려”