"韓 AI칩 성공하려면…엔비디아와 격차부터 인정해야"
리벨리온 박성현 대표 인터뷰
'엔비디아 대항마'는 잘못된 목표
첫단추 잘못 끼워, 바로잡을 시점
NPU는 AI 추론에서 경쟁력
구글 AI칩의 80% 성능이 타깃
소프트웨어 장벽 넘을 수 있나
오픈소스 진영의 반격 활발
서버·랙 단위 통신 분야에선
브로드컴·마벨 연합이 추격

리벨리온은 퓨리오사AI와 함께 한국 인공지능(AI) 반도체 시장을 개척 중인 ‘국가대표’ 스타트업이다. 탈(脫)엔비디아를 위한 희망으로 정부와 투자업계의 기대를 한 몸에 받고 있다. 하지만 박성현 리벨리온 대표는 9일 한국경제신문과의 인터뷰에서 뜻밖의 얘기를 꺼냈다. “현 상황에서 리벨리온이 엔비디아의 범용성을 꺾을 수 있다고 말하는 것은 거짓말”이라고 했다. 그는 “첫 단추가 잘못 끼워졌다”며 “(국내 AI 스타트업이 만든) 칩이 엔비디아보다 A가 좋다, B가 좋다는 식의 프레임이 지속되는 게 과연 건강한 것인지 되짚어볼 필요가 있다”고 말했다.
▷엔비디아와의 비교 담론이 문제라는 얘기인가.
“AI의 훈련, 추론을 막론하고 엔비디아 칩의 성능은 압도적이다. 우리는 저 넓은 영역 중에서도 추론, 추론 시장 안에서도 특정 세그먼트(분야)를 겨냥하고 있을 뿐이다. 우리의 목표는 ‘NPU(신경망처리장치) 진영’에서 1위를 하는 것이다. 구글 TPU의 80% 정도 따라잡으려고 시도하고 있다.”
▷‘엔비디아 대항마’라는 말이 흔히 쓰이는데.
“특정 벤치마크에서 국내 칩이 엔비디아를 앞설 수는 있다. 벤치마크를 유리하게 잡으면 100배 좋은 성능도 나온다. 하지만 100가지가 넘는 엄청난 종류의 벤치마크 중에서 겨우 두세 개 앞서는 것으로, 그것도 실전에 당장 적용할 수 없는 모델로 테스트하고 ‘엔비디아 칩보다 좋다’고 하는 건 거짓말이다.”
▷리벨리온의 ‘특정 세그먼트’는 무엇인가.
“멀티모달을 타깃으로 하고 있다. 언어뿐만 아니라 소리, 그림, 영상 등도 이해할 수 있는 AI 모델이다. AI가 동영상을 이해할 수 있는 시대가 오면 리벨리온 칩이 더 빛날 수 있다는 자신감이 있다.”
▷무엇을 목표로 삼고 있는가.
“고객사 총소유비용(TCO)을 3분의 1로 줄이는 것이다. TCO는 두 가지 측면으로 나뉜다. 설비투자(CAPEX)와 운영비(OPEX)다. 엔비디아의 칩은 비싸고, 전력 소모가 크다. 우리는 ‘특정 세그먼트’에서 엔비디아 H200의 3분의 1 가격으로 3분의 1의 전력을 소요하는 칩을 만드는 것을 목표로 삼고 있다.”
▷실현 가능한 목표인가.
“당장 할 수 있다는 것은 아니다. 하지만 대량 양산 체제가 된다면 해볼 만한 타깃 수치다. 지금은 소프트웨어 고도화 등 여러 가지 면에서 엔비디아를 쫓아가는 입장이다. 엔비디아와의 격차를 인정하는 것이 모든 것의 출발점이다.”
▷최근 리벨 쿼드를 출시했는데.
“AI 연산기 4개를 한 개 기판 위에 결합한 칩렛 형태고, 5세대 HBM(HBM3E) 4개를 장착한 점에서 ‘빅칩(big chip)’이다. 칩 스펙 자체는 엔비디아 A100을 넘어 H200과 거의 동일하다. 삼성 엑시노스 AP 8~9개 이상의 칩을 하나로 합친 성능이기도 하다.”
▷칩당 전력은 어느 정도인가.
“현재 600~1000W 정도인데 이걸 하드웨어·소프트웨어 최적화를 통해 500~600W 수준으로 밀어 넣는 작업을 하고 있다. 엔비디아 제품은 칩당 1000W를 훌쩍 넘는다. 아직 고객사가 원하는 수준을 맞춘 것은 아니지만 일단 예선은 통과했다. 최적화 작업은 최소 1년씩 걸린다.”
▷소프트웨어 경쟁력에 대한 의문이 있다.
“엔비디아 소프트웨어가 얼마나 훌륭한지 말하는 건 입이 아플 정도다. 포인트는 이들을 어떻게 따라잡을지를 구상하는 것이다. 소프트웨어의 핵심은 컴파일러다. 컴파일러는 앞단(프런트엔드)과 뒷단(백엔드)으로 나뉜다. 우리는 그중에서 프런트엔드 쪽의 변화를 유심히 보고 있다.”
▷엔비디아 쿠다(CUDA)를 넘을 방법이 있는가.
“지금 AI업계에선 제2의 리눅스 모먼트라고 할 만큼 거대한 판도 변화가 느껴진다. AI 빅테크가 ‘탈엔비디아’를 하려면 쿠다(CUDA) 같은 소프트웨어를 걷어내야 한다는 문제가 있는데, 이걸 오픈소스로 해결하려고 하고 있다.”
▷서버 단위에서 칩 경쟁력을 평가해야 한다는 얘기가 나온다.
“요즘 데이터센터는 ‘AI 토큰 생성기’ 역할을 한다. 궁극적으로는 데이터센터의 모든 랙이 얼마나 많은 토큰을 뱉어낼 수 있는지만을 봐야 한다는 것이다. 우리도 이것을 고민하고 있다. 랙 스케일 역시 엔비디아를 쫓아가야 하는 입장이 맞다.”
▷어떻게 돌파해야 하는가.
“서버와 서버, 랙과 랙 간 통신은 마벨과 브로드컴이 잘한다. 지금은 엔비디아와 마벨·브로드컴 진영이 대결하는 국면이다. 이런 상황에서 우리가 단독으로 잘할 수는 없다. 그래서 마벨과 협업한다. 제일 중요한 랙의 스위치 칩뿐만 아니라 랙 단위의 중앙처리장치(CPU)까지 공동으로 개발하고 있다.”
▷리벨 쿼드의 고객사가 있는가.
“미국 빅테크에 시제품을 공급한 상태다. 그들이 우리에게 테스트 조건을 전달했고 자체 실험을 했다. 405B 모델을 8장의 카드로 나눠 연산할 때 실제 전력 기반으로 H200보다 약 2.3배 뛰어난 전성비를 보였다는 테스트 결과를 만들어냈다. 현재 가장 범용으로 쓰이는 칩과 동등한 스펙에서 비교된 건 아니지만 ‘대체할 수 있다’는 잠재력을 보여줬다.”
강해령 기자 hr.kang@hankyung.com
Copyright © 한국경제. 무단전재 및 재배포 금지.
- '초고속 승진'에 벌어지는 연봉 격차…질투 커지는 2030 ['영포티' 세대전쟁]
- "같은 서울 맞나"…강남 국평 아파트 팔면 외곽 아파트 16채
- "ㄱㄱ, ㅅㅂ 구해요. ㅌㄹ 주세요"…의미 모를 초성 클릭해보니 '깜짝'
- “목돈 없어도 괜찮아요”...자녀에게 세금없이 1억4000만원 증여하는 법 [나수지의 차곡차곡재테
- 구혜선, 특허품 '쿠롤' 출시 "K-컬처의 확장…완판 기대"
- 작황 부진에도 고구마 28% 급락
- "비싼 옷 살 필요 없죠" 가성비족 몰리자…유니클로 또 '난리'
- "국민연금 30년 꼬박 부었는데 이럴 줄은"…은퇴자들 '하소연' [일확연금 노후부자]
- 이제는 오픈AI의 저주? 2달 새 시총 461조 날린 오라클
- "아이온2에 회사 운명 걸렸는데…" 엔씨소프트, 15%대 급락