AI, 그리고 반도체[테크트렌드]
2022년 11월 30일 오픈AI가 챗GPT를 대중에게 알린 이후 2023년의 키워드는 단연 AI(인공지능)였다. 2016년 구글 알파고가 이세돌 9단과의 대국에서 승리할 때만 해도 세상은 인공지능이 모든 것을 해결할 것처럼 보였다. 영화나 만화에서 보던 세상이 곧 올 것이라 기대했다.
하지만 현실은 달랐다. 알파고 이후 개선된 인공지능이 등장했고 일부 서비스에 인공지능이 적용됐지만 실제 사람들이 체감하는 느낌은 그전과 큰 차이가 없었다. 더 정확히 말하자면 인공지능이 사람들의 삶을 바꾸지 않았다.
그런데 2023년의 인공지능은 파격적이었다. 챗GPT의 등장에 호기심으로 접근했던 사람들은 새로운 인공지능이 그 전과는 다른 결과물을 전해주고 이를 활용해 지금까지와 다른 세상을 만들 수 있다는 희망을 봤다. 사람의 자연어를 인식하고 상황에 맞는 답을 내놓는 인공지능을 보며 알파고 이후 인공지능에 회의적이었던 시선이 다시 뜨거운 불을 지피게 만들었다. 그리고 이러한 인공지능의 처리를 위한 반도체에 2024년 시선이 모아지고 있다.
CPU, GPU, NPU
개인용 컴퓨터의 발전사는 CPU의 발전사와 맥을 같이한다. 과거 XT, AT라 불리던 컴퓨터부터 386, 486 그리고 펜티엄까지 인텔에서 만든 CPU를 탑재한 개인용 컴퓨터는 CPU의 명칭을 컴퓨터 명칭으로 부를 만큼 그 중요성이 컸다. CPU란 중앙연산처리장치(Central Processing Unit)로 데이터의 연산과 처리를 담당한다. 컴퓨터의 성능을 좌우할 만큼 중요한 처리 장치로 굉장히 복잡한 연산을 고성능의 코어가 담당하여 처리하는 형태다.
복잡한 연산을 처리하다 보니 CPU 내에 들어갈 수 있는 코어의 개수가 한정적이다. 머리를 고도로 많이 쓰다 보니 한 가지 연산 업무에 집중할 수밖에 없다. 말 그대로 복잡한 연산을 순서대로 처리하는 형태이다.
GPU(Graphics Processing Unit)는 CPU와는 다른 성격을 갖고 있다. 태생이 그래픽을 처리하기 위해 만들어지다 보니 CPU보다 단순한 연산 목적으로 만들어졌다. 대신 굉장히 많은 양의 연산을 병렬로 처리한다. 말 그대로 저성능의 코어가 단순 연산을 동시 다발적으로 처리해 결과를 만들어내는 형태다.
최초의 GPU는 요즘 가장 핫한 기업인 미국의 엔비디아(NVIDIA)에서 지포스라는 이름으로 1999년에 처음 출시했다. 이전까지의 컴퓨터 화면은 단순 색상만을 구현할 수 있었지만 GPU가 등장하면서 지금은 일반적인 3D 그래픽을 나타낼 수 있게 됐다. 모니터 화면 각각의 픽셀에 대한 색상, 명암 등 단순한 연산의 동시다발적 처리를 통해 이러한 그래픽을 구현할 수 있게 된 것이다. 그리고 이러한 병렬 연산의 기능은 단순 연산의 무한 반복인 인공지능 시대에 빛을 발하고 있다.
NPU(Neural Processing Unit)는 GPU보다 특정 목적에 적합하도록 연산의 범용성을 줄여놓은 것이다. GPU가 병렬 처리를 위한 구조를 갖고 있고 인공지능 연산을 위해 사용되었지만 GPU는 근본적으로 그래픽 처리를 위해 만들어졌고 연산의 범용성을 갖고 있다.
그러나 인공지능이 발전함에 따라 각각의 상황과 특성에 맞는 효율적인 프로세서가 필요해졌다. 이를 해결하기 위해 나온 것이 바로 NPU다. 흔히 요즘 AI 반도체라고 언급되는 프로세스로 기존 GPU보다 전력 소모를 줄이면서 실시간으로 인공지능 연산을 통해 결과를 내야 하는 곳에 사용되고 있다.
예를 들어 챗GPT나 일반적인 인공지능 연산의 경우 GPU 서버를 활용하여 대량의 연산을 처리하는 게 효과적이지만 자율주행 차량의 시스템이나 스마트폰과 같이 특정한 목적을 위해 실시간으로 제한된 전력을 사용하는 인공지능 처리에는 NPU가 사용되기 시작했다. 또한 금융이나 특정 목적의 대량 연산을 위한 서버에도 범용 연산의 GPU 대신 NPU를 적용하려는 시도가 최근 나타나고 있다.
AI 반도체의 승자는 엔비디아?
지난해가 오픈AI의 해였다면 올해는 엔비디아의 한 해가 될 거 같다. 챗GPT와 같은 생성형 AI가 등장하면서 초기 사람들의 관심은 생성형 AI인 챗GPT와 오픈AI 자체에 쏠렸다.
이러한 현상은 금세 각 기업들이 자체적으로 LLM(Large Language Model) 기반의 생성형 AI를 만들 수 있다는 희망 쪽으로 방향이 바뀌었고 이러한 인공지능의 연산을 위한 기반을 확보하기 위한 각축전이 펼쳐지기 시작했다. 풍부한 정보와 이러한 정보를 학습시킬 수 있는 학습법이 있다고 해도 이를 받아들일 뇌가 없다면 학습의 시작 자체를 할 수 없다. 또한 뇌가 있다고 해도 학습량을 처리할 수 있는 연산의 처리 속도가 용량에 차이가 있다면 결과를 내는 시기나 결과의 품질은 달라진다.
여기에 엔비디아는 가장 적절한 솔루션으로 보인다. 1999년부터 개발한 GPU는 현재 원래의 목적인 그래픽 향상을 위한 처리보다 인공지능 처리를 위한 서버용 프로세서로 더욱 각광받고 있다.
현재까지 딱히 대안이 보이지 않는다. 이러한 상황은 주가나 실적에서도 명확하게 나타나고 있다. 이미 주가는 주당 780달러를 돌파했고 1년 전과 비교했을 때 3배가 넘는 상승률을 보여주고 있다. 2023년 연간 실적 역시 2022년과 비교 했을 때 매출은 126%, 당기순이익은 581%를 기록할 만큼 고공행진을 하고 있다. 시가 총액 역시 2조 달러를 돌파하며 애플과 마이크로소프트에 이어 3위권으로 올라섰다. 엔비디아의 세상이 열린 것이다.
왜 엔비디아일까
사실 엔비디아와 어깨를 겨루던 GPU 업체가 있었다. 바로 AMD다. 하지만 지금 엔비디아와 AMD의 차이를 AI 반도체를 거론할 때 AMD는 거론조차 되지 않고 있다. 두 업체 모두 GPU를 만들었지만 지금의 AI 반도체 시장은 엔비디아가 독점하고 있다. 이러한 상황은 엔비디아 GPU의 우수한 성능도 기여를 했지만 이보다는 인공지능 개발 환경에서의 호환성이 차이를 만들었다. 엔비디아는 CUDA라는 GPU에서 처리되는 병렬 연산을 다양한 프로그래밍 언어로 작성할 수 있도록 해주는 환경이다.
또한 GPU의 고유 기능인 그래픽의 병렬 처리에서 CPU가 처리하는 일반적인 연산을 수행할 수 있도록 해주는 환경 역시 제공하고 있다. 쉽게 말해 GPU를 CPU처럼 사용하되 GPU가 가진 원래의 장점인 병렬 처리를 살리고 또한 개발자들의 다양한 언어를 사용해 쓸 수 있게끔 해준다는 것이다. 이러한 환경 제공은 GPU의 우수한 성능에 기반해 인공지능 개발자들이 GPU를 손쉽게 사용해 머신러닝이나 딥러닝의 연산 처리를 가능토록 했다.
지금까지 GPU와 개발 환경을 제공해 주는 회사는 엔비디아뿐이다. 여기에 엔비디아는 다양한 분야에 대응했다. 일반적인 AI 데이터센터용 GPU뿐만 아니라 자율주행 차에 탑재될 AI 반도체의 개발에도 공을 들이고 있고 현재 대다수의 자율주행 개발 업체들은 엔비디아의 차량용 AI 반도체를 사용해 자율주행을 개발 중이다. AI 시대에 엔비디아에 대한 종속이 당분간은 지속될 수밖에 없는 이유다.
Next AI의 주인공은
최근 애플이 자율주행 전기차 개발을 중단하고 해당 개발 인력을 인공지능 개발에 투입했다는 뉴스가 있었다. 또한 오픈AI의 샘 올트먼부터 메타의 마크 저커버그까지 한국을 방문하며 AI 반도체 개발을 위해 협업할 한국 기업들을 찾고 있다.
분명한 것은 생성형 AI를 비롯해 현재의 인공지능 붐이 중요하지만 초기 단계라는 점이다. 각 기업이나 국가가 자체적인 경쟁력 확보를 위해 인공지능 개발에 본격적인 투자를 시작하는 단계이고 인공지능 연산의 근간이 되는 반도체를 개발, 생산할 수 있는 업체와 나라는 한국을 포함해 몇 개 되지 않는다.
과거를 비춰보면 초기 하드웨어 경쟁력을 갖춘 업체가 큰 성장을 하지만 결국 그 하드웨어를 활용한 솔루션과 소프트웨어 파워를 가진 업체가 최종 승자가 됐다.
지금 선택의 기로에 있다. 과거와 달리 우리에겐 하드웨어와 소프트웨어, 그리고 NPU를 직접 설계하는 스타트업이 있다. 현재는 오픈AI나 엔비디아일지 모를 인공지능 시대의 주인공이 우리 안에서 나올 수 있지 않을까라는 기대를 해본다.
최형욱 CJ대한통운 상무
Copyright © 한경비즈니스. 무단전재 및 재배포 금지.