인텔 AI칩 '가우디 3' IBM 클라우드 도입으로 첫 상용화

(서울=뉴스1) 김민석 기자 = 인텔은 차세대 인공지능(AI) 가속 칩인 '가우디 3'(Gaudi 3)가 IBM 클라우드에 도입된다고 8일 밝혔다.
가우디 3는 △생성형 AI △대규모언어모델(LLM) 추론 △파인튜닝 △검색 증강 생성(RAG) 워크로드에 최적화한 설계를 채택했다.
인텔 관계자는 "가우드 3 AI 칩은 개방형 개발 프레임워크를 지원한다" 며 "멀티모달 LLM과 최신 AI 트렌드에 맞춘 아키텍처를 갖췄다"고 설명했다.
가우드 3는 IBM 클라우드를 통해 독일 프랑크푸르트, 미국 워싱턴 D.C., 텍사스 댈러스 리전에 우선 적용된다. IBM 가상 프라이빗 클라우드(VPC) 가상 서버를 통해 접근할 수 있다.
인텔은 레드햇 오픈시프트와 IBM 왓슨엑스(watsonx)와 통합도 2분기 내 완료할 예정이다.

인텔이 의뢰한 시그널65 최신 벤치마크 결과에 따르면 가우디 3은 메타의 Llama-3.1-405B-Instruct-FP8 모델 실행 시 경쟁 제품 대비 92% 높은 비용 효율성을 기록했다.
처리량도 IBM의 Granite-3.1-8B-Instruct 모델 기준 소규모 워크로드에서 초당 토큰 처리량이 43% 높았다.
사우라브 쿨카니 인텔 데이터센터 AI 전략 담당은 "가우디 3의 IBM 클라우드 도입으로 기업 고객은 추론과 파인튜닝에 최적화된 성능으로 생성형 AI 워크로드를 확장할 수 있게 됐다"며 "전 세계 기업들은 비용 효율성을 높인 AI를 구현할 수 있을 것"이라고 말했다.
ideaed@news1.kr
<용어설명>
■ 멀티모달 멀티모달(Multimodal)은 멀티(Multi·복수)와 모달(Modal·형태)을 결합한 용어로 서로 다른 여러 형태의 데이터를 동시에 처리하고 이해하는 기술이나 방식을 의미한다.
■ RAG RAG(Retrieval-Augmented Generation·검색증강생성)은 대규모언어모델(LLM)의 텍스트 생성 능력에 외부 데이터베이스나 지식 기반에서 실시간으로 정보를 검색해 이를 결합해 더 정확하고 최신성 있는 답변을 생성하는 기술이다.
■ 검색
Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.
- 성격·외모·생식기 모두 여성인 4살 아이, 코골이 심해 염색체 검사 '아들'
- "생리 때문에 미안" "먼저 잠들어 서운"…'모텔 살인녀' 자작 메시지 소름
- 남경주 형 "동생은 사고뭉치, 고교 때 삼청교육대 끌려갔다" 과거 '파묘'
- "상간남과 담판, 불륜 후에도 술자리·남자 문제 여전…이혼 못한 제 잘못?"
- "광고 달라" 야망 드러낸 충주맨…'쇼츠팩1억, 브랜드 콘텐츠 8천' 공개
- "결혼 못할줄 알았는데" 박진희, 5세 연하 판사와 러브스토리 공개
- "지 XX 좀 만졌다고"…6살 아이 추행한 노인, 말리는 엄마 목 조르기[영상]
- 35억 아파트 경품 건 유튜버 "다음은 갤러리아포레"…당첨돼도 고민, 왜?
- '대구 알몸 근육맨' 나체 상태 검지 치켜들고 퇴근길 교통 정리 [영상]
- 고현정, 55세 맞아? 믿기지 않는 동안 비주얼…로마 빛낸 미모