알리바바, 신규 AI 모델·칩 꺼냈다…에이전틱 AI 인프라 전면 고도화

큐원3.7-맥스·젠우 M890·판지우 AL128 동시 공개…"AI 풀스택 업그레이드"

(지디넷코리아=이나연 기자)알리바바가 에이전틱 인공지능(AI) 시대를 겨냥해 파운데이션 모델부터 클라우드 인프라·자체 AI 칩까지 아우르는 풀스택 업그레이드를 단행했다.

알리바바 그룹은 전날 열린 알리바바 클라우드 서밋에서 최신 거대언어모델(LLM) '큐원(Qwen)3.7-맥스'와 AI 학습·추론 프로세서 '젠우(Zhenwu) M890', 슈퍼노드 서버 '판지우(Panjiu) AL128' 등을 공개했다고 21일 밝혔다.

큐원3.7-맥스는 에이전틱 코딩과 복잡한 추론, 장기 작업 수행에 최적화된 범용 파운데이션 모델이다. 최대 35시간 연속 작동과 1000회 이상의 툴 호출을 성능 저하 없이 처리하며, 코드 생성·디버깅·오피스 워크플로 자동화·복잡한 멀티스텝 작업까지 수행할 수 있다.

오픈클로·헤르메스 에이전트·클로드 코드·큐원 포·큐더 등 주요 에이전트 프레임워크에 최적화됐으며 코딩·범용 에이전트·다국어 지원 등 주요 벤치마크에서 프론티어 모델과 경쟁력을 확보했다. 향후 알리바바 모델 서비스 플랫폼 '모델스튜디오'를 통해 전 세계 개발자에게 제공될 예정이다.

인프라 측면에서는 젠우 M890 AI 프로세서와 ICN 스위치 1.0 네트워킹 칩을 탑재한 판지우 AL128 슈퍼노드 서버를 중국 시장 대상으로 공개했다. 단일 랙 내 128개 AI 가속기를 고밀도로 집적해 페타바이트 퍼 세컨드(PB/s)급 단일 랙 대역폭을 제공한다.

알리바바의 반도체 설계 자회사 티헤드(T-Head)가 공개한 젠우 M890은 이전 모델 대비 3배 향상된 성능을 제공한다. 144기가바이트(GB) 그래픽처리장치(GPU) 메모리와 초당 800GB의 칩 간 대역폭을 갖추고 FP32부터 FP4까지 다양한 데이터 정밀도를 기본 지원한다.

ICN 스위치 1.0은 최대 25.6테라비트(Tbps) 총 대역폭과 극저지연 통신을 구현한다. 티헤드는 자사 칩의 컴퓨팅 잠재력을 극대화하는 독자 소프트웨어 스택 'T-Head SAIL'도 공개했다. 현재까지 젠우 칩은 56만개 이상 출하됐으며 20개 산업 분야의 400개 이상 외부 고객사가 활용하고 있다.

모델 서비스 플랫폼 '바이리엔(Bailian)'은 에이전트 실행 피드백 기반 강화학습 메커니즘인 에이전틱 RL을 도입해 지속적인 모델 개선을 추진하며, 에이전트 안전 거버넌스 기능도 기본 제공한다.

알리바바 그룹은 "이번 업그레이드를 통해 기업과 개발자가 AI 에이전트를 보다 효율적이고 안정적이며 높은 성능으로 구축·배포·확장할 수 있도록 지원할 것"이라고 말했다.

이나연 기자(ny@zdnet.co.kr)

IT/과학

알리바바, 신규 AI 모델·칩 꺼냈다…에이전틱 AI 인프라 전면 고도화