트웰브랩스, 실리콘밸리서 ‘멀티모달 해커톤’ 성료... 상용화 한걸음 더

조광현 기자(cho.kwanghyun@mk.co.kr) 2023. 10. 23. 09:21
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

영상 이해 모델(VLM) 기반 비즈니스 모델 발굴 및 실증 기회
TED AI, 일레븐랩스 공동 개최로 글로벌 시장 내 멀티모달 선두 기업 자리매김
사진제공=트웰브랩스
영상 이해 초거대 AI 개발 기업 ‘트웰브랩스(Twelve Labs, 대표 이재성)’는 TED AI, 음성 AI 전문 기업 일레븐랩스와 함께 ‘멀티모달 해커톤’을 성공적으로 개최했다고 23일 밝혔다.

지난 14일, 15일 양일간 미국 샌프란시스코에서 개최된 이번 해커톤에는 약 40개 팀 300명이 참가했다. 이번 해커톤에서 우승한 NeuroLearn팀은 트웰브랩스의 멀티모달 영상 이해 모델 API를 활용하여 학생별 영상 학습 정보를 분석하고 이를 바탕으로 맞춤형 학습을 돕는 프로젝트를 선보였다. 심사위원으로 구글, 오픈AI 등 글로벌 IT 기업의 현직자들이 참여하여 프로젝트 고도화를 위한 피드백을 제공하며 과제의 전문성과 완성도를 높였다.

트웰브랩스는 2021년 설립된 생성 AI 기업으로 영상 이해를 위한 초거대 AI 모델을 자체 개발한다. 멀티모달 신경망 기술을 활용해 영상 검색, 분류, 텍스트 생성 등 영상을 전문적으로 다루며 CB 인사이트 선정 ‘세계 100대 AI 기업’ 및 ‘세계 50대 생성 AI 스타트업’에 선정된 바 있다. 이 같은 기술력을 인정받아 총 220억 원 규모의 시드 투자를 마무리하였으며 오라클과의 대규모 클라우드 파트너십을 통해 수천 개의 최신 AI 학습용 엔비디아 A100 및 H100 GPU를 확보하는 등 글로벌 시장에서 선두 기업으로 입지를 다져가고 있다.

트웰브랩스가 높은 기술력을 자랑하는 ‘멀티모달’은 텍스트뿐 아니라, 이미지, 음성, 영상 등 다양한 종류의 데이터를 동시에 처리할 수 있는 AI 기술로 LLM 이후 가장 주목받는 기술이다. 구글은 다음 달 공개 예정인 차세대 LLM ‘제미니’에서 멀티모달 기능에 중점을 두고 있는 것으로 알려져 있으며, 오픈AI 역시 챗 GPT 유료 모드에 멀티모달 기술을 적용하는 등 글로벌 빅테크 기업들의 멀티모달 기술 경쟁이 격화되고 있다. 다만 글로벌 빅테크 기업들이 현재까지 이미지 처리에 집중하고 있는 반면 트웰브랩스는 영상 검색, 분류 등 영상 이해 솔루션에 집중하며 차별성을 두고 있다.

트웰브랩스 이재성 대표는 “TED AI와의 멀티모달 해커톤 공동 개최로 아직은 낯선 멀티모달에 대한 이해도를 높이고 실제 프로젝트 진행으로 트웰브랩스의 기술력을 입증할 수 있었다”라며 “해커톤에서 얻은 인사이트를 바탕으로 자사의 모델과 서비스를 고도화시켜 글로벌 시장의 개발자들과 엔터프라이즈 고객들에게 고품질의 API를 제공하겠다”고 밝혔다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?