反 엔비디아 진영과 협력…저전력 AI칩으로 승부하라

김현아 2024. 6. 27. 03:58
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

한국, 시스템 반도체 점유율 3%
70년 된 폰 노이만 구조를 깨라..PIM
네이버-인텔, 삼성-AMD 협력 강화해야
일본과 AI반도체 동맹 필요성

[이데일리 김현아 IT전문기자] 대한민국은 메모리 반도체 세계 1위, 파운드리 세계 2위를 자랑하지만 시스템 반도체(SoC) 분야 점유율은 3%에 그친다. 글로벌 인공지능(AI) 칩 시장이 2030년까지 1179억 달러(142조 원) 규모로 급성장할 전망인 가운데 AI 칩 대응에 실패할 경우 스마트폰 대응 실패로 몰락한 노키아처럼 한국의 반도체 강국 입지가 흔들릴 수 있다는 우려가 커지고 있다.

기술 장벽이 AI 칩보다 낮은 메모리 시장은 마이크론과 키옥시아 등과의 경쟁이 치열해지고 있는 반면 AI 칩 시장은 엔비디아의 독점 체제가 굳어지고 있기 때문이다.

전문가들은 AI 칩 대응 전략으로 자강(自强)과 글로벌 협력(協力), 두 축을 제시했다. 먼저 엔비디아의 GPU에 대응할 수 있는 저전력 프로세싱인 메모리(PIM)와 신경망처리장치(NPU) 고도화, 모바일 경쟁력을 활용한 온디바이스 AI나 엣지 서버 등에서 경쟁 우위를 확보해야 한다는 지적이다. 미국 이외의 중국, 일본 등 동남아 시장과 사우디아라비아 등 중동 시장을 겨냥한 인텔, AMD 같은 반(反) 엔비디아 진영과의 협업도 과제로 떠올랐다.

[이데일리 문승용 기자]


◇폰 노이만 구조를 깨라…PIM과 글로벌 협력


전문가들은 1950년대 이후 인텔의 중앙처리장치(CPU)와 엔비디아의 그래픽처리장치(GPU)에서 기본 구조로 사용됐던 ‘폰 노이만 구조’를 혁신해야 한다고 말한다. 70년간 유효했던 이 구조는 메모리가 데이터를 저장하고 연산은 프로세서가 담당하는 방식이다. 그러나 우리나라는 이 구조를 깨고 메모리가 연산도 처리하는 PIM(프로세싱 인 메모리) 개발을 추진 중이다.

정보통신기획평가원(IITP)에서 반도체·양자 국가 R&D PM으로 활동 중인 오윤제 박사는 “삼성전자(005930)는 메모리 일부를 연산자로 대체하는 ‘고대역폭 메모리(HBM)-PIM’을 세계 최초로 만들었고, SK하이닉스(000660)는 그래픽 D램에 PIM이 적용된 ‘GDDR6-AiM’을 만드는 등 연산 기능이 점점 메모리 안으로 들어오는 추세”라고 설명했다. 오 박사는 이어 “그러나 이 기술만으로는 모든 연산을 처리할 수 없어 NPU와 역할 분담을 해야 하며, 그 위에 엔비디아의 쿠다 같은 시스템 소프트웨어 생태계를 만들어야 한다”고 강조했다. 중국 역시 미국이 전략 자산인 AI 칩을 통제하려는 움직임에 대응, 칭화대에서 수백억 원을 투입해 PIM을 개발 중이다.

그러나 PIM 기술이 자칫 예상치 못한 결과를 낳을 수 있는 ‘김치 피자’가 될 우려도 있다. 이런 상황에서 제시되는 해법은 인텔, AMD 등과 협업하는 이른바 ‘글로벌 반(反) 엔비디아 진영’과의 협력이다. 네이버는 AI 칩의 다양성 확보를 위해 인텔과 ‘가우디’ 칩 기반의 소프트웨어 스택 개발에 협력하고 있으며, 삼성은 시스템 반도체 개발과 파운드리 사업에서 AMD와 협력하고 있다.

임종인 대통령 사이버 특별 보좌관(고려대 정보보호대학원 석좌교수)은 “원천 기술 개발도 중요하지만 국가적인 판단이 필요하다”며 “삼성과 AMD 간 협업이 더욱 긴밀해지도록 정부가 돕거나, 미국 정부의 엔비디아 독점 조사처럼 우리나라에서도 정책적 방안을 강구해야 한다”고 언급했다.

CES 2024에 전시된 온디바이스AI 칩, ‘발열’ 문제 거론돼

올해 세계 최대 전자제품 전시회(CES)에서는 ‘온디바이스 AI 칩’들이 많이 전시됐지만, 실제로 만져보면 뜨거워 깜짝 놀랐다는 평가가 많았다. 온디바이스 AI란 휴대폰이나 노트북 같은 전자기기에 신경망 처리 장치(NPU)를 탑재해 인터넷 연결 없이도 생성형 AI를 구동할 수 있게 만드는 기술이다. 그러나 AI 모델을 아무리 경량화해도 전력 소모가 상당하다. 단말기에 탑재된 AI 모델도 약 10억 개의 파라미터(매개변수)를 가진다.

AI 반도체의 제왕으로 불리는 엔비디아도 과도한 전력 소모 문제로 골머리를 앓는 상황에서 한국의 AI 반도체 기업들은 저전력 기술 개발에 집중해야 한다는 지적이다. 엔비디아가 내년에는 ‘블랙웰 울트라’를, 2026년에는 차세대 GPU 아키텍처인 ‘루빈(Rubin)’ R100을 출시하는 등 GPU 신제품 출시 주기를 2년에서 1년으로 앞당긴다 해도 GPU의 설계 구조를 근본적으로 바꾸기는 어렵다는 것이다.

GPU는 새로운 AI 모델을 만드는 학습과 완성된 AI 모델을 기반으로 사용자에게 서비스를 제공하는 추론까지 지원하지만, 정확성을 높이기 위해 다양한 머신러닝 기능을 사용한다. 그러다 보니 에너지 효율이 낮다. 반면 NPU는 특정 모델에 최적화되어 비교적 낮은 전력을 소모한다.

딥엑스의 김녹원 대표는 “엔비디아와 서버 칩 시장에서 경쟁하는 것은 쉽지 않지만, 딥엑스는 저전력 기술로 엔비디아의 20분의 1 수준 전력 소비를 목표로 개발하고, 가격도 10분의 1에서 20분의 1로 낮추는 전략을 세웠다. 이러한 전략으로 온디바이스 AI 시장을 정조준해 미래를 대비하고 있다”고 말했다.

[이데일리 문승용 기자]


◇脫엔비디아 가능할까?…중국, 일본, 사우디 시장 뜬다


거대언어모델(LLM)에 필요한 AI 모델의 크기가 커지면서 고성능 AI 칩 확보가 중요해지고 있지만, 현재 글로벌 AI 칩 시장은 97%를 엔비디아가 독점하고 있다.

이러한 독점 상황에 대응하기 위해 인텔과 같은 반(反) 엔비디아 진영 기업들은 한국 기업들과의 협력을 모색하고 있다. 지난해 11월 방한한 팻 겔싱어 인텔 CEO는 JW 메리어트 호텔에서 네이버에 협업을 제안하며 “무엇을 원하느냐”고 묻기도 했다. 일본 소프트뱅크는 지난 5월 한국의 AI 반도체 팹리스 기업들과 협력 방안을 논의했다. 일본에도 AI 반도체 회사인 프리퍼드네트웍스(PFN)가 있지만, 서버용 AI 반도체를 개발하지는 않는다.

네이버로부터 1억달러(1390억원)규모의 디지털트윈 솔루션을 도입한 사우디아라비아도 자체 LLM 구축을 위한 AI 반도체 확보에 관심을 두고 있으며, 엔비디아를 배제하고 한국 기업들과 접촉하고 있다. 하정우 네이버 AI 이노베이션센터장은 26일 국회AI포럼 창립식에서 “중국이 자국 AI 반도체를 수입하면 아랍어 중심으로 만들어주겠다고 제안하며 미국의 중동 진출을 막는 것 같다”며 “중동 시장에 한국 AI 반도체 수출 가능성이 있다”고 전했다.

김현아 (chaos@edaily.co.kr)

Copyright © 이데일리. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?