데이터브릭스, 현존 최강 오픈소스 LLM DBRX 공개

이덕주 특파원(mrdjlee@mk.co.kr) 2024. 3. 28. 00:57
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

데이터 및 AI 기업 데이터브릭스가 표준 벤치마크에서 모든 오픈소스 모델을 능가하는 범용 대형언어모델(LLM) DBRX를 출시했다.

알리 고드시 데이터브릭스 공동창립자 겸 CEO는 "데이터브릭스는 데이터와 AI를 보편화하겠다는 사명 아래 모든 기업에 데이터 인텔리전스를 제공하여 그들이 보유 중인 데이터를 이해하고 이를 활용하여 자체적인 AI 시스템을 구축할 수 있도록 지원하고 있다"면서 "DBRX는 최신 업계 벤치마크에서 기존 오픈소스 모델을 능가하고, 대부분의 벤치마크에서 GPT-3.5를 뛰어넘는 수준"이라면서 "독점 모델을 오픈소스 모델로 대체하는 추세가 가속화될 것"이라고 설명했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

기존 오픈소스와 GPT 3.5 앞서
빠르면서도 비용효율적인 모델
다른 벤치마크와 DBRX의 성능비교. <데이터브릭스>
데이터 및 AI 기업 데이터브릭스가 표준 벤치마크에서 모든 오픈소스 모델을 능가하는 범용 대형언어모델(LLM) DBRX를 출시했다.

27일(현지시간) 데이터브릭스는 보도자료를 통해 DBRX를 공개하고 이날부터 바로 사용할 수 있다고 밝혔다. DBRX는 기업을 위한 맞춤형 고성능 LLM의 학습과 튜닝을 보편화할 수 있을 것으로 기대된다.

알리 고드시 데이터브릭스 공동창립자 겸 CEO는 “데이터브릭스는 데이터와 AI를 보편화하겠다는 사명 아래 모든 기업에 데이터 인텔리전스를 제공하여 그들이 보유 중인 데이터를 이해하고 이를 활용하여 자체적인 AI 시스템을 구축할 수 있도록 지원하고 있다”면서 “DBRX는 최신 업계 벤치마크에서 기존 오픈소스 모델을 능가하고, 대부분의 벤치마크에서 GPT-3.5를 뛰어넘는 수준”이라면서 “독점 모델을 오픈소스 모델로 대체하는 추세가 가속화될 것”이라고 설명했다.

그는 “DBRX는 전문가 혼합 아키텍처를 사용해 초당 토큰 전송 속도가 매우 빠르며 비용 효율적”이라면서 “이런 점에서 DBRX는 오픈소스 LLM의 새로운 기준을 제시해 기업이 자체 데이터를 기반으로 맞춤형 추론 기능을 구축할 수 있는 플랫폼을 제공해 준다”고 말했다.

알리 고드시 데이터브릭스 공동창립자 겸 CEO. <사진=데이터브릭스>
DBRX는 언어 이해, 프로그래밍, 수학 및 논리와 같은 표준 업계 벤치마크에서 메타의 라마2 70B 및 M미스트랄 8x7B와 같은 기존 오픈소스 LLM보다 뛰어난 성능을 제공한다.

DBRX는 일부 벤치마크에서 GPT-3.5의 성능을 능가한다.

데이터브릭스에 따르면 DBRX는 전문가 혼합(MoE, mixture-of-experts) 아키텍처로 DBRX를 최적화했다. 이로 인해 DBRX는 다른 주요 LLM대비 최대 2배 높은 컴퓨팅 효율을 갖추고 있다. 또한 DBRX는 주어진 시간에 360억 개의 매개변수만 사용한다. 모델 자체는 1320억 개 파라미터이므로 속도(토큰/초) 대 성능(품질) 측면에서 두 마리 토끼를 모두 잡을 수 있다는 설명이다.

[실리콘밸리=이덕주 특파원]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?