시작은 RTX 4060과 가성비 경쟁, 인텔 2세대 아크 그래픽 배틀 메이지 발표

인텔의 2세대 아크 그래픽 카드, 코드네임 배틀 매이지가 공식 발표되었다.

우선 공개된 모델은 메인스트림급인 아크 B580과 B570 2종으로, 공식 가격은 각각 249달러와 219달러이며, 아크 B580은 2024년 12월 13일, 아크 B570은 2025년 1월 16일 출시될 예정이다.

공식 스펙은 앞서 유출된 정보들과 같이 아크 B580은 20Xe2 코어와 12GB VRAM, 아크 B570은 18Xe2 코어와 10GB VRAM이 탑재되며, TBP는 각각 190W와 150W에 8핀 보조전원 커넥터 1개가 요구된다.

공개된 성능 지표에 따르면 아크 B580은 전 세대 모델인 아크 A 시리즈 중 아크 A750과 비교시 평균 24% 높은 성능을 발휘하며, 지포스 RTX 4060 대비 평균적으로 10% 높은 성능을 제공한다.

가성비면에서 아크 B580은 RTX 4060 대비 일반 래스터 게임에서 32%, 레이 트레이싱 게임은 25% 높은 가치를 제공한다.(이상 QHD 해상도의 최고 품질 기준) 아직 출시까지 한 달 이상이 남은 아크 B570의 성능 지표는 이번 발표 내용에 포함되지 않았다.

한편, 아크 B580의 경우 인텔 레퍼런스 디자인인 'LE(Limited Editon)' 모델의 경우 지포스  RTX 30 시리즈부터 적용되어온 스크린 쿨링 디자인으로 확인되었다. 인텔은 에이서, 애즈락, 군니르(GUNNIR), 오닉스 테크놀로지(ONIX Technology), 맥선, 스파클을 파트너사로 소개하였다.

이 중 스파클, 에이서, 맥선 제품도 스크린 쿨링 적용이 확인되었으며, 타 파트너사의 제품들도 스크린 쿨링 방식의 제품을 내놓을 가능성이 점쳐진다.

한편, 1세대 아크 그래픽 (코드네임 알케미스트) 제품군을 감안했을 때 하이엔드 모델로 예상되는 아크 B7xx 시리즈에 대해 인텔은 말을 아꼈다.

이것이 배틀 메이지, 인텔 아크 B 시리즈

인텔은 아크 B 시리즈(이하 배틀 메이지) 발표와 함께 게이머들을 위한 플랫폼 개선 사항들도 공개했다. 이 중에는 XeSS2와 AI 워크로드 가속을 위한 XMX와 관리를 위한 드라이버 개선 사항들이 포함되는데, 이들 내용을 정리했다.

인텔 배틀 메이지에 적용된 Xe2 아키텍처는 최근 AMD Zen5와 인텔 애로우 레이크와 같이 고효율을 추구해 1세대 아크(코드네임 알케미스트)와 비교해 성능은 70% 이상, 전성비는 50% 개선된 것이 특징이다.

아크 B580에 탑재된 BMG-G21 코어는 Xe2 코어당 각 8개의 벡터 엔진과 XMX 엔진과 1개의 레이 트레이싱 유닛이 통합되었다. 이는 유닛 갯수만 고려하면 알케미스트 대비 절반으로 줄어든 것이지만 벡터 엔진은 512bit, XMX 유닛은 20048bit를 지원해 폭이 두 배로 확대되어 결과적으로 처리 용량 자체는 동일하다.

전체 L2 캐시의 경우 알케미스트 ACM-G10 코어의 16MB서 18MB로 늘렸고, 듀얼 멀티 포멧 트랜스코더(MFX)를 탑재해 인코딩과 디코딩 작업 효율을 높인 것이 특징이다. MFX는 AV1, H.265 4:2:2 10-bit, H.264, VP9 코덱을 지원한다.

클럭 기반의 처리 능력은 아크 A750dl 17.2TFLOPS인데 반해 아크 B580은 14.6TFLOPS로 낮아졌지만, SIMD(Single Instruction Multiple Data)를 기본 32단위에서 16단위로 바꿔 작업 효율을 높이고, Xe 코어 당 L1$/ SLM 캐시는 알케미스트의 192KB서 256KB로 확장해 단순 수치 이상의 효율을 끌어낸 것이 특징이다.

벡터 엔진은 알케미스트에서 지원하던 INT8, INT4, FP16, BF16 포맷과 더불어 네이티브 INT2와 TF32를 지원한다. INT2는 매우 작은 정수 연산시 처리량을 최대 두 배로 높여주고, 8bit 지수와 10bit 가수가 포함된 19bit gudtlrdml TF32 (tensor float 32)는 FP16과 FP32에 비해 높은 연산 정밀도와 처리량을 제공할 것으로 기대된다.

하드웨어 레이트레이싱 유닛은 횡단 파이프라인과 박스 인터섹션의 1.5배, 트라이앵글 인터섹션이 두 배 강화되었고, 이를 뒷받침하기 위한 BVH캐시도 두 배로 늘어나 전반적인 레이 트레이싱 성능 개선도 기대된다.

인텔도 만든다 프레임, 프레임 생성 기능 적용된 XeSS2

배틀 메이지는 하드웨어와 더불어 게이밍 환경 개선을 위한 생태계 지원도 강화되었다. 그 중 가장 눈에 띄는 부분은 AMD와 엔비디아에서 지원 중인 프레임 생성 기능이 추가된 XeSS(Xe Super Sampling)2다.

XeSS2는 업스케일링 기술인 XeSS-SR(Super Resolution), 프레임 생성 기술인 XeSS-FG(Frame Generation), 프레임 생성시 발생하는 레이턴시 증가를 완화하기 위한 Xe-LL(Low Latency) 기능의 결합으로, AMD의 FSR3과 엔비디아의 DLSS 3과 유사한 구성이다.

XeSS2의 XeSS-SR은 기본적으로 기존 업스케일링 기술도 동일하지만 지원 API가 DX11/ DX12/ 벌칸까지 확장되었고, XeSS-FG는 경쟁사들과 같이 프레임 생성을 위해 모션 벡터와 깊이 정보, 옵티컬 플로우 리프로젝션과 모션 벡터 리프로젝션 데이터를 활용한다.

결과적으로 업스케일링과 프레임 생성 기능이 결합된 XeSS2는 단순 업스케일링만 적용된 1세대 기술과 비교해서 최대 65% 가까운 추가 성능 향상을, 기본 성능과 비교해 최대 4배 가까운 성능을 기대할 수 있다.

엔비디아는 프레임 생성 기능 구현을 위해 별도 로직(OFA, Optical Flow Accelerator)을 추가한 지포스 RTX 40 시리즈 이상을 요구하는 것과 달리, 인텔 XeSS2에 추가된 프레임 생성 기능은 XMX 코어를 사용해 옵티컬 플로우 리프로젝션과 모션 백터 리프로젝션을 수행한다.

이는 원칙적으로 XMX 코어가 탑재된 모든 아크 그래픽에서 이용할 수 있다는 뜻과 함께 DLSS와 깉이 사용 가능한 하드웨어가 인텔 아크 그래픽으로 제한된다는 의미로 해석된다.

한편, 레이턴시 개선으리 위한 Xe-LL 기술은 기본 랜더 환경에 비해 45% 개선이 가능하며, 업스케일링 및 프레임 생성과 함께 사용할 때의 레이턴시를 업스케일링만 적용했을 때와 같은 수준으로 억제 가능하다고 소개했다.

배틀 메이지의 XMX, RTX 40 시리즈의 텐서 코어보다 빠른 AI 가속기

인텔은 XeSS2에 업데이트된 프레임 생성 기능을 담당하는 배틀 메이지의 AI 가속기인 XMX 코어에 대해서도 발표가 이뤄졌다. 알케미스트의 XMX와 비교해 특별히 바뀐 점을 설명하지는 않았지만, 경쟁 모델로 포지셔닝한 지포스 RTX 4060과 비교해 LLM 성응이 최대 50% 빠르다는 점을 강조했다.

생성형 AI를 비롯해 AI 기능 활용 과정에서 업체의 개인 정보 무단 활용과 같은 우려를 불식 시키기 위해 AMD와 엔비디아, 인텔 모두 그래픽 카드의 AI 엔진 기반으로 동작하는 로컬 AI 어플리케이션을 제공하고 있는데, 이러한 작업에서 경쟁 모델보다 더욱 빠른 성능을 기대할 수 있다.

오버클럭 지원 포함, '아크 컨트롤'아닌 '인텔 그래픽 소프트웨어'

인텔은 배틀 메이지 발표와 함께 제어 프로그램인 '아크 컨트롤'의 개선점도 함께 발표했다.

이에 따르면 인텔 그래픽 제어를 위한 기존 '아크 컨트롤'은 '인텔 그래픽 소프트웨어'로 이름을 바꾸고, 바뀐 환경에 맞춰 개선된 모습을 보인다.

올인원 허브를 지향하는 '인텔 그래픽 소프트웨어'는 그래픽 드라이버 업데이트 제공은 기본에, 어플리케이션별 프로파일 설정, 이미지 샤프닝과 애니소트로픽 필터링, 어댑티브 테셀레이션 등 세부 튜닝, DX9 및 DX11 레거시 타이틀을 위한 글로벌 그래픽 옵션도 지원한다.

또한 오버레이를 통해 디스플레이 정보, VRR, 색상, 스케일링 모드 등 다양한 디스플레이 옵션, 게임 성능, 메모리 사용량, 온도 등의 정보를 즉각 확인할 수 있고, 동작 속도와 전압, 팬 컨트롤, 전력 세팅 등의 성능 튜닝도 가능하다.

제목 : 시작은 RTX 4060과 가성비 경쟁, 인텔 2세대 아크 그래픽 배틀 메이지 발표

보드나라 : www.bodnara.co.kr