"이미지만 보여줘도 답변 척척"…카카오, 새 오픈소스 AI 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
카카오 자회사인 카카오브레인이 이미지를 텍스트로 해석할 수 있는 인공지능(AI)을 공개했다.
오픈소스로 이 기술을 시장에 풀어 생성형 AI 생태계를 빠르게 구축할 예정이다.
다른 국내 기업들도 이미지를 활용한 멀티모달 기술로 생성 AI 시장에 도전장을 낸 상태다.
LG AI연구원도 지난달 자체 AI 모델인 '엑사원 2.0'을 통해 이미지를 텍스트로 설명해주는 기술을 공개했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
네이버·LG도 시장 공략 나서
카카오 자회사인 카카오브레인이 이미지를 텍스트로 해석할 수 있는 인공지능(AI)을 공개했다. 오픈소스로 이 기술을 시장에 풀어 생성형 AI 생태계를 빠르게 구축할 예정이다.
카카오브레인은 자체 개발한 멀티모달 대규모언어모델(LLM)인 ‘허니비’를 AI 오픈소스 플랫폼인 ‘깃허브’에 선보였다고 19일 발표했다. 멀티모달은 텍스트뿐 아니라 사진, 그림, 영상, 음성 등 다양한 형태의 콘텐츠를 입·출력할 수 있는 AI 모델을 뜻한다.
이용자가 이미지를 올린 뒤 텍스트로 질문하면 허니비는 텍스트로 답을 내놓는다. 농구 경기 중인 두 명의 선수 이미지를 올린 뒤 왼쪽 선수가 몇 번 우승했는지를 물어보면 우승 횟수를 알려주는 식이다. 다만 텍스트는 영문만 지원한다.
카카오는 AI 기술을 오픈소스 플랫폼으로 외부 공개하는 방식을 택했다. 허니비를 활용한 자체 서비스 개발에만 집중하기보다 다양한 업체가 허니비를 활용해 각종 서비스를 내놓을 수 있도록 하겠다는 전략이다. 카카오 관계자는 “허니비는 교육이나 학습 보조 용도로 우선 활용될 수 있을 것”이라며 “카카오브레인도 이를 활용해 각종 서비스를 확장하는 안을 고려하고 있다”고 말했다.
카카오는 자체 LLM인 ‘코GPT 2.0’을 지난해 말 공개하기로 했지만 출시가 미뤄졌다. 이 업체는 범용으로 활용할 수 있는 중형 LLM 대신 산업 영역별로 특화한 경량 LLM 위주로 생성 AI 서비스를 내놓는 안을 고려하고 있다. 충분한 수익성을 확보하기 위해선 AI 모델의 몸집을 줄여 서비스 호출 비용을 최소화해야 한다는 게 카카오의 판단이다.
다른 국내 기업들도 이미지를 활용한 멀티모달 기술로 생성 AI 시장에 도전장을 낸 상태다. 네이버는 연내 자체 AI 모델인 ‘하이퍼클로바X’로 이미지, 음성 등의 입력을 지원하는 게 목표다. LG AI연구원도 지난달 자체 AI 모델인 ‘엑사원 2.0’을 통해 이미지를 텍스트로 설명해주는 기술을 공개했다. 아마존웹서비스(AWS) 플랫폼으로 이 기술을 풀어 해외 시장을 공략하겠다는 구상이다.
생성 AI 시장을 선도했던 오픈AI는 지난해 9월 챗GPT에 음성, 이미지 인식 기능을 추가했다. 구글도 지난달 멀티모달 AI 모델인 제미나이를 공개했다. 삼성전자의 갤럭시S24 시리즈에 도입되는 이미지 분석 기술인 ‘서클 투 서치’도 제미나이를 활용한다.
이주현 기자 deep@hankyung.com
Copyright © 한국경제. 무단전재 및 재배포 금지.
- 넷마블 메타버스 계열사, 전직원에 권고사직 통보
- '안 닮고 싶은 상사' 투표 결과에 충격 휩싸인 기재부 [관가 포커스]
- "하얀 석유 100만t 터졌다"…옆나라 중국 또 '대박'
- "수십년 장사, 이런 적은 처음"…압구정 맛집도 '폐업 공포'
- "수익 4배 이상 늘었어요"…'고당도 감귤' 없어서 못 판다 [송영찬의 신통유통]
- 故 이선균 보낸 후 전혜진 근황?…소속사 "팬들 위해 올린 예전 사진"
- 이경규 "반려견 6마리 키워서 치매 안 걸려"…진짜일까? [건강!톡]
- '갤S24' 라방하다가 역대급 사고…가수 강남 '기겁'
- '소아과 의사' 서려경, 3월 여자 복싱 세계 챔피언 도전한다
- "전기차 안 사요" 결국 터졌다…'초유의 사태' 맞은 독일車