트웰브랩스, 영상 AI 업데이트 “현존 최고 성능”

원호섭 기자(wonc@mk.co.kr) 2024. 3. 14. 15:27
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

영상이해 초거대 인공지능(AI) 개발 기업 트웰브랩스가 초거대 AI 영상언어 생성 모델 '페가수스(Pegasus-1)'와 멀티모달 영상이해 모델 '마랭고(Marengo 2.6)'를 업데이트 출시했다고 14일 밝혔다.

이재성 트웰브랩스 대표는 "트웰브랩스의 모델은 영상이해에 특화되어 오픈AI의 소라, 구글 제미나이가 제공하는 영상생성과는 차이가 있다"라며 "페가수스 및 마렝고 모델은 영상 언어 초거대 모델들로는 수행 불가한 세밀한 수준의 작업까지 지원하는 만큼 영상이해 기술을 핵심 산업들에 최적화하여 본격적인 확산을 추진하겠다"라고 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

트웰브랩스, ‘페가수스’ 및 ‘마렝고’ 모델 업데이트 출시
영상이해 초거대 인공지능(AI) 개발 기업 트웰브랩스가 초거대 AI 영상언어 생성 모델 ‘페가수스(Pegasus-1)’와 멀티모달 영상이해 모델 ‘마랭고(Marengo 2.6)’를 업데이트 출시했다고 14일 밝혔다.

트웰브랩스는 2022년 말 오라클과의 대규모 클라우드 파트너십을 통해 수천 대의 최신 엔비디아 GPU를 확보하며 모델 고도화를 이루어냈다. 특히 글로벌 거대 정보통신 기업의 AI 스타트업 대비 적은 인력과 자금으로 경쟁력 있는 기술 및 서비스를 제공한다는 점에서 주목받고 있다.

지난 한 해에 CB 인사이트 선정 ‘세계 100대 AI 기업’, ‘세계 50대 생성 AI 스타트업’에 선정된 바 있으며, 엔비디아, 인텔, 삼성넥스트, 한국투자파트너스 등으로부터 1000만 달러(한화 약 140억 원) 규모의 전략적 투자를 유치하기도 했다.

페가수스는 초거대 AI 영상언어 생성 모델로 지난해 11월 정식 공개되어 영상에 대한 요약, 하이라이트 생성 등 영상 기반 텍스트 생성 기능들을 최초로 선보인 바 있다. 이번 업데이트로 영상에 관해 궁금한 점들을 질문하면 답을 해주는 영상 질의응답 성능이 대폭 향상됐다. 또한 기존 모델은 홈페이지 내 대기자 명단 등록을 통해서만 사용할 수 있었던 반면, 이번 업데이트부터는 일반 대중에게 공개되어 누구나 쉽고 편리하게 페가수스 모델에 접근 및 활용할 수 있다. 유료 버전의 경우 대량의 영상 활용이 필요한 기업과 개발자들에게 보다 합리적인 가격으로 제공된다.

마렝고는 영상뿐 아니라 이미지, 음성 기반 모델을 통틀어 전 세계에서 가장 강력한 멀티모달 기반 모델이다. 트웰브랩스는 “이번에 출시한 페가수스와 마렝고 모델이 구글의 제미나이 1.5 프로, 오픈AI의 GPT-4V 등 현존하는 최고 성능의 상용 및 오픈소스 영상언어 모델들과 비교하여 최대 43%가량 성능 우위를 보인다”고 밝혔다.

이재성 트웰브랩스 대표는 “트웰브랩스의 모델은 영상이해에 특화되어 오픈AI의 소라, 구글 제미나이가 제공하는 영상생성과는 차이가 있다”라며 “페가수스 및 마렝고 모델은 영상 언어 초거대 모델들로는 수행 불가한 세밀한 수준의 작업까지 지원하는 만큼 영상이해 기술을 핵심 산업들에 최적화하여 본격적인 확산을 추진하겠다”라고 밝혔다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?