IBM 클라우드, 인텔 가우디3 기반으로 상용 서비스
[아이뉴스24 권서아 기자] 인텔은 IBM 클라우드가 자사의 가우디 3 인공지능(AI) 가속기 기반 상용서비스를 제공한다고 8일 밝혔다.
이는 가우디 3를 이용한 첫 대규모 상용 서비스로서, 클라우드 기반 AI 인프라 시장에서 고성능·고비용 GPU 독점 구도에 변화가 생길 지 주목된다.
![인텔과 IBM 클라우드 관련 이미지 [사진=인텔]](https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202505/08/inews24/20250508125017886mgom.jpg)
가우디 3은 생성형 AI, 대규모 언어모델 추론, 파인튜닝, RAG(검색 증강 생성) 등 최신 워크로드에 최적화돼 있다. 개방형 개발 프레임워크를 지원하며, IBM 클라우드 내에서는 독일 프랑크푸르트, 미국 워싱턴 D.C. 및 댈러스 리전에서 우선 제공된다.
IBM VPC(가상 프라이빗 클라우드)에서 사용 가능하며, 왓슨엑스(watsonx), 레드햇 오픈시프트 등 주요 플랫폼과의 연동도 예정돼 있다.
AI 인프라 고도화가 가속화되는 가운데, 가우디 3의 가장 큰 강점은 '성능 대비 비용 효율'이다. 인텔이 의뢰한 시그널65의 최신 벤치마크에 따르면, 메타의 라마(Llama)-3.1-405B-FP8 모델 기준에서 경쟁 GPU 대비 92% 높은 비용 효율성을 기록했다.
IBM의 크래나이트(Granite)-3.1-8B-인스트럭트(Instruct) 모델 기준으로는 처리 속도(TPS)에서 43% 우위를, Llama 모델 기준 대용량 워크로드에서도 36% 높은 처리량을 보였다.
사우라브 쿨카니 인텔 AI 전략 담당은 "이번 협력은 기업들이 AI를 보다 합리적인 비용으로 실용화할 수 있도록 돕는 전환점으로, 가우디 3은 클라우드에서의 추론·미세조정 작업에 최적화된 플랫폼"이라고 말했다.
IBM 클라우드 인프라 총괄 사틴더 세티도 "가우디 3은 고객에게 더 많은 선택권과 자유, 그리고 낮은 진입 장벽을 제공한다"고 강조했다.
/권서아 기자(seoahkwon@inews24.com)Copyright © 아이뉴스24. 무단전재 및 재배포 금지.
- '이재명 43% vs 김문수 29%'…'이재명 44% vs 한덕수 34%' [NBS]
- '수업'은 거부하면서 '장학금'은 받고 싶다?⋯4600여 명 의대생, 국가장학금 신청
- '블랙커피', 하루 2잔이면 인슐린 저항성 23%↓⋯특히 '이 성별'에 효과적
- 비의료인 불법 요양기관 신고한 제보자, 포상금이 무려 16억원?
- 권성동 "김문수 회견, 한심해⋯중견 정치인 맞나"
- 과기정통부, 4000억 규모 'K-클라우드 프로젝트' 추진
- "메타몽·보노보노 뜬다"…롯데월드타워·몰 캐릭터 축제
- 백종원의 더본코리아, 농산물품질원 특사경 조사까지 받는다
- 김문수 "양자, 일주일 간 선거운동 후 단일화 결정하자"[종합]
- 이재명 "어르신 국민연금 감액 개선…여유롭게 지내도록"