[고든 정의 TECH+] 엔비디아에 도전장 내민 인텔..GPU 시장 왕좌 빼앗을까?

2021. 8. 21. 14:16
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[서울신문 나우뉴스]

웨이퍼를 든 라자 코두리 인텔 수석 부사장. 출처=인텔

인텔이 인텔 아키텍처 데이 2021 행사를 통해 12세대 코어 프로세서인 엘더 레이크, 게이밍 GPU인 알케미스트, 그리고 고성능 연산용 GPU인 폰테 베키오의 아키텍처에 대한 상세한 정보를 공개했습니다. 흥미롭게도 이런저런 루머가 나돌았던 알케미스트(Xe-HPG, 고성능 게이밍)와 폰테 베이오(Xe-HPC, 고성능 연산)의 기본 구조는 엔비디아가 2018년 출시한 튜링 GPU의 모습과 약간 닮은 부분이 있습니다.

이번 공개 내용을 보면 과거 실행 유닛(EU)이라고 불린 그래픽 연산 유닛은 이제 벡터 엔진으로 이름이 바뀌었고 벡터 엔진 옆에는 인공지능 관련 연산을 담당하는 매트릭스 엔진(XMX)이 같은 숫자만큼 존재합니다. 그리고 여러 개의 벡터 엔진과 매트릭스 엔진 아래 하드웨어 레이 트레이싱(Ray Tracing)을 담당하는 부분이 있습니다.

그런데 엔비디아의 튜링 GPU 역시 그래픽 연산을 담당하는 쿠다(CUDA) 코어와 인공지능 연산을 담당하는 텐서 코어, 그리고 하드웨어 레이 트레이싱을 지원하는 RT 코어를 지니고 있습니다. 참고로 레이 트레이싱은 광원에서 나온 빛이 여러 사물의 표면에 반사되는 경로를 계산해 현실적인 빛의 효과를 그래픽에 추가하는 기술입니다.

인텔의 Xe 코어 구조와 엔비디아의 튜링 SM 구조. 출처=인텔/엔비디아

재미있는 사실은 현재 인텔의 GPU 개발을 담당한 라자 코두리가 2017년 AMD에서 인텔로 이적했다는 점입니다. 라자 코두리 수석 부사장은 본래 라데온 GPU를 개발하면서 엔비디아의 지포스에 맞섰던 사람입니다. 그런 그가 찾아낸 해법 역시 엔비디아와 비슷한 셈입니다. 물론 라데온의 길을 다시 걷기보다는 현재 업계 1위인 엔비디아를 타도하는 것이 옳은 전략이라는 점은 의심의 여지가 없습니다.

하지만 그렇다고 인텔이 무조건 엔비디아를 따라하기만 한 건 아닙니다. 인텔의 GPU 제조 방식은 엔비디아와 큰 차이가 있습니다. 바로 CPU를 개발하면서 축적한 다이 간 연결 기술인 포베로스(Foveros)와 EMIB(embedded multidie interconnect bridge)를 이용해 서로 다른 공정에서 만든 반도체 칩을 연결해 매우 큰 GPU를 만드는 방식입니다.

많게는 수백억 개의 트랜지스터를 집적한 최신 GPU는 한 번에 실수 없이 제조하기가 쉽지 않습니다. 특히 다이 사이즈가 커질수록 제조가 어려워집니다. A100처럼(TSMC 7nm 공정 사용) GPU 다이 크기가 826㎟이나 되고 트랜지스터 숫자도 542억 개나 되면 그렇지 않아도 비싼 웨이퍼에 수율도 좋지 않아 가격이 꽤 비싸 집니다.

인텔은 이 문제에 대한 해결책으로 여러 개의 작은 반도체 칩을 평면으로 연결하는 고속도로인 EMIB와 수직으로 연결하는 방식인 포베로스 기술을 개발했습니다. 이렇게 하면 반도체 패키징 과정이 매우 복잡해지는 문제가 있지만, 대신 꼭 최신 미세 공정을 적용하지 않아도 되는 부분은 더 저렴한 공정을 사용할 수 있고 한 번에 제조가 매우 어려운 초대형 프로세서도 만들 수 있습니다.

인텔이 공개한 폰테 베키오는 5개의 다른 공정으로 만든 47개의 반도체 조각인 액티브 타일(Active Tile)을 포베로스와 EMIB 기술로 연결해 무려 1000억 개 이상의 트랜지스터를 지닌 초대형 GPU입니다. 현재까지 상용화된 가장 복잡한 프로세서인 엔비디아의 A100보다 두 배의 트랜지스터 집적도를 지니고 있습니다. 연산 능력 역시 FP32 기준으로 45TFLOPS 이상으로 A100의 19.5TFLOPS의 두 배가 넘습니다. 오랜 세월 개발한 포베로스와 EMIB 기술이 이제 빛을 본 셈입니다.

폰테 베키오 GPU의 구조와 연산 능력. 출처=인텔

인텔은 이날 아키텍처 데이 행사에서 알케미스트 GPU의 연산 성능은 공개하지 않았으나 폰테 베키오의 연산 능력은 구체적으로 명시했는데, 슈퍼 컴퓨터/데이터 센터/인공 지능 연산을 위한 고성능 GPU 시장에서 엔비디아를 압박하겠다는 뜻으로 풀이됩니다. 코두리 수석 부사장은 회사를 옮겨도 주적은 엔비디아로 한결같다는 점이 재미있습니다.

이번 공개에서 마지막으로 주목할 점은 인텔이 TSMC의 최신 미세 공정인 6nm (N6), 5nm (N5) 공정을 사용하기로 한 것입니다. 알케미스트 GPU는 6nm 공정으로 제조되어 미세 공정에서 경쟁자보다 약간 우위에 섰고 폰테 베키오는 인텔 7 공정을 포함한 다양한 미세 공정을 사용하지만, 컴퓨트 타일은 5nm 공정을 사용해 역시 경쟁자보다 앞서고 있습니다. 최소한 미세 공정에서 밀리는 일은 없다는 이야기입니다. GPU 생산은 TSMC에 외주를 맞길 것이라는 점은 이미 알려진 내용이지만, 이번 발표를 보면 인텔이 얼마나 상대방을 이기고 싶어 했는지를 짐작할 수 있습니다.

인텔의 발표 내용을 신뢰한다면 폰테 베키오 GPU가 나오는 순간 엔비디아의 A100은 1위 자리를 내줘야 합니다. 물론 작년에 A100을 내놓은 엔비디아 역시 차세대 GPU를 개발 중이라 순순히 1위 자리를 내주지는 않을 것입니다. GPU 시장 진출을 선언한 인텔이 시작부터 엔비디아를 위협할지 아니면 엔비디아가 다시 1위 자리를 지킬 수 있을지 결과가 주목됩니다.    

고든 정 칼럼니스트 jjy0501@naver.com

▶서울신문 나우뉴스 통신원 및 전문 프리랜서 기자 모집합니다 나우뉴스(nownews.seoul.co.kr) [페이스북] [군사·무기] [별별남녀] [기상천외 중국] - 저작권자 ⓒ 서울신문사 -

Copyright © 서울신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?