‘새로운 반도체 설계와 효율 개선’ AMD 라이젠 9000 프로세서의 핵심 요소는?

강형석 2024. 7. 18. 19:18
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[IT동아 강형석 기자] 2024년 7월 9일(미국 현지 시각), AMD는 미국 로스앤젤레스 웨스틴 보나벤처 호텔에서 ‘테크데이(Tech Day)’를 개최하고 차세대 라이젠(Ryzen) 프로세서를 공개했다. 약 2년 만에 이뤄지는 세대교체지만, AMD는 플랫폼에 변화를 주지 않았다. 새 칩세트를 품은 메인보드를 공개했지만, 업그레이드는 기존 메인보드로도 가능하기 때문이다. 신규 시장과 업그레이드 시장 모두 잡겠다는 전략이다.

데이비드 맥아피(David McAfee) AMD 그래픽스ㆍ클라이언트 채널 총괄 관리자 및 상무는 “AMD는 소비자에게 비용 대비 뛰어난 성능과 효율성을 제공해왔다. 한계를 뛰어넘고 싶은 애호가들에게는 유연성도 제공했다. 이 약속은 앞으로도 변함없을 것이다. 플랫폼 수명을 연장하고 업그레이드를 꾸준히 제공할 계획이다. 라이젠 9000 시리즈도 그 연장선에 있을 것”이라고 말했다.

온도 저항성 낮춰 속도 높이고 효율 개선에 집중해

라이젠 9000 시리즈는 새로운 중앙처리장치 설계인 5세대 젠(Zen)이 적용됐다. 핵심은 크게 4가지로 나눌 수 있다. 첫 번째는 클럭당 더 많은 명령어 처리가 가능하도록 조율된 구조가 적용된 점이다. AMD는 고급 분기 예측이 포함된 듀얼 파이프 펫치(Dual Pipe Fetch with Advanced Branch Prediction)를 적용했다.

라이젠 9000 시리즈는 데이터가 이동하는 길이 넓어지고 인공지능 처리 명령어가 추가됐다. / 출처=IT동아

분기 예측은 중앙처리장치가 데이터를 처리하는 과정에서 발생 가능한 위험 요소를 줄인다. 어떤 명령어가 실행되는지 예상한 후 미리 다음 명령어 처리를 준비하는 방식이다. 5세대 젠은 할당된 자원을 가져오는 핵심 요소를 재설계했다. 초기 데이터 처리에 필요한 라인을 2중 배치(Dual decode pipes)한 부분이 대표적이다. 실행 파이프라인을 더 넓게 구성해 지연 시간과 정확도 등을 개선했다. 명령어 공간의 지연 시간과 대역폭도 늘렸다.

마크 페이퍼마스터 AMD 부사장 및 최고기술책임자는 “더 넓은 대역폭과 확장된 실행 창구를 통해 예비 공간(캐시 메모리)들이 효율적으로 실행된다. 매우 중요한 변화의 시작이라 할 수 있다”고 말했다.

두 번째 변화는 할당 자원을 배치하고 실행하는 라인을 확장한 것이다. 데이터 실행 순서(스케줄러)를 다듬고 통합 산술연산장치(Arithmetic Logic Unit - ALU)를 활용한다. 기존에는 산술연산장치 4개를 배치해 명령어를 처리했지만, 이번에는 6개로 늘렸다. 정수 연산을 위한 장치도 추가 배치해 명령어 처리 구조를 최적화했다.

세 번째 변화는 데이터 대역폭의 확대다. 12방향 1차 데이터 예비공간(L1 Data Cache) 용량을 48KB로 구성했는데 이는 이전의 32KB 대비 50% 증가한 수치다. 데이터는 클럭당 4회 주기(4회 읽기, 2회 쓰기)로 입출력된다. 2차 예비공간(L2 캐시)도 16방향 1MB 용량으로 구성한 상태다. 그 결과 1차 예비공간의, 대역폭이 2배 상승하면서 클럭당 많은 데이터 처리가 가능해졌다.

마지막 변화는 512비트 인공지능 데이터 연산이다. 5세대 설계에서는 고급 벡터 확장 명령어인 AVX(Advanced Vector Extensions)-512를 지원한다. 기존에는 256비트로 두 번 나눠 처리한 것과 달리 이번에는 완전한 512비트 데이터 처리가 이뤄진다. 부동소수점 피연산자 추가 명령어(Floating ADD) 처리 주기도 3주기에서 2주기로 줄였다. 신경망 가속 명령어 VNNI(Vector Neural Network Instruction)를 추가한 점도 특징이다. 정수와 부동소수점을 다양하게 쓰는 인공지능 데이터 처리 환경에 대응하려는 조치다.

제품을 구성하는 일부 소재를 개선해 온도와 전력소모를 낮췄다. / 출처=IT동아

반도체 설계 최적화로 성능을 높였다면 소재에 의한 변화도 있었다. 크게 효율성 증가와 온도 저하에 따른 안정성 등이다. 데이비드 맥아피 상무는 “라이젠 9000 시리즈를 개발하면서 방열판 디자인부터 열전도 재료, 반도체 구성을 최적화하기 위해 개발자들이 노력했다”고 말했다.

라이젠 9000 시리즈의 변화는 온도 저항성(Thermal Resistance) 개선이다. 칩 위에 얹는 방열판(히트스프레더)을 다듬고 안에 채우는 열전도 물질을 일부 바꿔 온도 저항성을 15% 개선했다. AMD 자료에 따르면 동일한 열설계전력(TDP) 제품 기준 7도 가량 낮은 온도로 작동한다. 온도가 낮아지는 것은 곧 작동속도를 더 높일 수 있음을 의미한다. 기준 속도를 높이는 작업인 오버클럭(Overclock) 작업에 유리할 것으로 예상된다.

전력 소모도 줄였다. 16코어 기반 라이젠 9 프로세서는 170W로 동일하지만, 12코어는 170W에서 120W로 낮췄다. 8코어, 6코어 라이젠 프로세서도 기존 105W에서 65W가 되었다. 하지만 성능은 제품에 따라 최대 11~22% 가량 상승했다. 성능 향상이 열설계전력 기준이어서 환경에 따라 다르지만, 기존 동급 제품 대비 성능 향상은 체감이 가능할 것으로 예상된다.

DDR5-8000 대응, PCI-E 5.0 기반 인공지능 플랫폼 강조

AMD는 플랫폼 사용자들이 더 다양한 성능 경험이 가능한 방법을 제안했다. 대표적인 게 오버클럭이다. 정해진 속도 이상을 구현해 성능을 높이는 작업인데 라이젠 9000 시리즈는 온도와 전력소모를 낮춰 물리적 요건은 갖춘 상태다. 속도를 높이면 발열과 전력소모량 상승이 뒤따르기 때문이다. 이어 상승하는 중앙처리장치의 작동속도에 따라 메모리 작동속도 빨라져 고성능 메모리와 짝을 이뤄야 한다.

데이비드 맥아피 상무는 DDR5-8000 메모리 사양을 새로운 AMD 포괄적 통합 소프트웨어 설계(AMD Generic Encapsulated Software Architecture – AGESA)에서 지원할 예정이라고 설명했다. 중앙처리장치와 DDR5 메모리의 작동속도 동기화로 더 빠른 성능을 낼 수 있을 것으로 예상된다. AMD 자료에 따르면 프리시전 부스트 오버드라이브(Precision Boost Overdrive)를 통해 평균 6~15% 가량 성능이 향상된다. 세밀한 조정이 이뤄지면 더 높은 성능을 구현할 수 있지만, 냉각장치 선택이 중요해진다.

라이젠 AI 300 시리즈 외에 라이젠 9000 시리즈와 호흡을 맞추는 AM5 플랫폼도 인공지능 PC 시대를 맞이할 준비를 마쳤다. 노트북 PC와 달리 데스크톱 시스템은 인공지능을 위해 별도의 그래픽카드를 쓴다. 엔비디아 지포스, AMD 라데온, 인텔 아크 등이 외장 그래픽카드로 시장에 판매되고 있다.

AMD는 라이젠 9000 시리즈와 AM5 플랫폼이 인공지능 시대에 적합한 플랫폼이라고 강조했다. / 출처=IT동아

흔히 데스크톱 PC에 그래픽카드를 한 개 쓰는 게 일반적이다. 그러나 인공지능 추론 및 학습을 위해 여러 그래픽카드를 쓰기도 한다. 이 때 그래픽카드와 저장장치 등이 플랫폼을 최대한 활용하는지 여부가 중요하다. 라이젠 9000 시리즈는 PCI-E 5.0 레인을 총 28개 제공하는데 그래픽카드와 초고속 저장장치를 자유롭게 구성할 수 있는 수치다.

다만 5세대 PCI-E 대역을 모두 쓰려면 X870 계열 메인보드가 필요하다. 가격은 높을 것으로 예상되나 USB 4.0과 중앙처리장치ㆍ메모리 오버클럭을 지원한다. B850은 저장장치만 5세대 PCI-E를 쓰고 그래픽카드는 4세대 PCI-E를 쓴다. USB 장치도 3.2를 지원하는 점이 아쉽다. 그러나 중앙처리장치ㆍ메모리 오버클럭을 지원하기 때문에 합리적인 비용으로 성능 향상을 노리는 소비자에게 알맞다. B840은 3세대 PCI-E를 쓰고 오버클럭도 메모리만 가능하다.

AMD는 라이젠 9000 시리즈 중앙처리장치를 2024년 7월 31일에 출시할 예정이다. 제품은 6코어부터 16코어까지 다양하게 갖췄다. 출시와 함께 인텔 14세대 코어 프로세서와 경쟁하게 되는데, 기존 설계를 따르는 제품 특성상 직접 경쟁은 어려워 보인다. 실제 경쟁은 인텔의 차세대 데스크톱용 중앙처리장치 ‘애로우레이크(Arrow Lake)’가 출시되는 2024년 4분기가 될 전망이다.

글 / IT동아 강형석 (redbk@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)

Copyright © IT동아. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?