인텔 AI칩 '가우디 3' IBM 클라우드 도입으로 첫 상용화

김민석 기자 2025. 5. 8. 18:45
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

"AI 인프라 선택지 확대…글로벌 리전 적용"
인텔 가우디 3 인포그래픽(인텔 제공)

(서울=뉴스1) 김민석 기자 = 인텔은 차세대 인공지능(AI) 가속 칩인 '가우디 3'(Gaudi 3)가 IBM 클라우드에 도입된다고 8일 밝혔다.

가우디 3는 △생성형 AI △대규모언어모델(LLM) 추론 △파인튜닝 △검색 증강 생성(RAG) 워크로드에 최적화한 설계를 채택했다.

인텔 관계자는 "가우드 3 AI 칩은 개방형 개발 프레임워크를 지원한다" 며 "멀티모달 LLM과 최신 AI 트렌드에 맞춘 아키텍처를 갖췄다"고 설명했다.

가우드 3는 IBM 클라우드를 통해 독일 프랑크푸르트, 미국 워싱턴 D.C., 텍사스 댈러스 리전에 우선 적용된다. IBM 가상 프라이빗 클라우드(VPC) 가상 서버를 통해 접근할 수 있다.

인텔은 레드햇 오픈시프트와 IBM 왓슨엑스(watsonx)와 통합도 2분기 내 완료할 예정이다.

인텔-IBM

인텔이 의뢰한 시그널65 최신 벤치마크 결과에 따르면 가우디 3은 메타의 Llama-3.1-405B-Instruct-FP8 모델 실행 시 경쟁 제품 대비 92% 높은 비용 효율성을 기록했다.

처리량도 IBM의 Granite-3.1-8B-Instruct 모델 기준 소규모 워크로드에서 초당 토큰 처리량이 43% 높았다.

사우라브 쿨카니 인텔 데이터센터 AI 전략 담당은 "가우디 3의 IBM 클라우드 도입으로 기업 고객은 추론과 파인튜닝에 최적화된 성능으로 생성형 AI 워크로드를 확장할 수 있게 됐다"며 "전 세계 기업들은 비용 효율성을 높인 AI를 구현할 수 있을 것"이라고 말했다.

ideaed@news1.kr

<용어설명>

■ 멀티모달 멀티모달(Multimodal)은 멀티(Multi·복수)와 모달(Modal·형태)을 결합한 용어로 서로 다른 여러 형태의 데이터를 동시에 처리하고 이해하는 기술이나 방식을 의미한다.

■ RAG RAG(Retrieval-Augmented Generation·검색증강생성)은 대규모언어모델(LLM)의 텍스트 생성 능력에 외부 데이터베이스나 지식 기반에서 실시간으로 정보를 검색해 이를 결합해 더 정확하고 최신성 있는 답변을 생성하는 기술이다.

■ 검색

Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.