'AI 열풍' 복병 만난 차기 슈퍼컴... GPU값 급등에 구축사업 험난

이현주 2023. 9. 6. 04:30
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

KISTI, 6호기 세 번째 입찰공고 예정
AI 열풍 타고 GPU 반도체 몸값 상승 
기술 변화 반영 늦은 탓에 예산 부족
R&D 예산 깎는데 전기료 부담 커져
게티이미지뱅크

미국 오크 리지 국립연구소가 보유한 슈퍼컴퓨터 '프론티어(Frontier)'는 현존하는 가장 빠른 초고성능 컴퓨터다. 지난해 구축된 프론티어는 사상 최초로 엑사플롭스(Exaflops)급 성능을 기록했다. 엑사플롭스는 1초에 100경(京) 번의 연산을 할 수 있다는 의미다. 2008년 미국 로스 앨러모스 국립연구소의 '로드러너(Roadrunner)'가 최초로 페타플롭스(1초에 1,000조 번 연산) 시대를 연지 14년 만이다. 프론티어의 실측 성능은 1.194엑사플롭스로 1초에 119경 번의 연산이 가능하며, 이는 전 세계 슈퍼컴퓨터 2위인 일본 이화학연구소 '후가쿠(Fugaku)' 성능의 2.7배에 달한다. 슈퍼컴퓨터 업계에선 바햐흐로 '엑사스케일'의 시대가 열린 셈이다.


엑사스케일 시대, 한국 슈퍼컴은...

한국 슈퍼컴퓨터의 현주소는 어떨까. 올해 6월 기준 세계 슈퍼컴퓨터 상위 500위에 이름을 올린 한국과학기술정보연구원(KISTI)의 국가슈퍼컴퓨터 5호기 '누리온'의 자리는 49위다. 2018년 도입된 누리온의 실측 성능은 13.9페타플롭스로 도입 당시에는 세계 순위가 11위였지만, 5년이 지나자 최신 슈퍼컴퓨터들에 의해 후순위로 밀려난 것이다. 그만큼 우리나라 과학기술 인프라가 뒤쳐졌다는 뜻이다.

초고성능컴퓨터 세계 순위. 그래픽=박구원 기자

KISTI는 내년 가동을 목표로 600페타플롭스 성능의 슈퍼컴퓨터 6호기 구축에 나섰지만, 이마저도 난관에 봉착해 있다. 5일 KISTI에 따르면 KISTI 국가슈퍼컴퓨팅본부는 내주 슈퍼컴퓨터 6호기 3차 입찰 공고를 낼 예정이다. 지난 5월부터 두 차례 공고를 냈지만, 응찰한 기업이 없었기 때문이다. KISTI는 지난해 예비타당성조사를 거쳐 2,929억원의 예산을 확보했는데, 이 가격에 KISTI가 요구하는 성능을 만족시킬 만한 기업이 나타나지 않은 것이다.


몸값 높아진 GPU, 대폭 할인이라도....

슈퍼컴퓨터의 가격이 예산 한도를 넘어선 데 결정적인 영향을 미친 것은 그래픽처리장치(GPU)다. GPU는 하나의 계산이 끝난 다음에 다른 계산을 하는 중앙처리장치(CPU)와 달리, 많은 계산을 동시에 '병렬 처리'한다. 이 때문에 거대 문제 계산이나 인공지능(AI) 활용에 GPU가 널리 쓰이기 시작했고, 미국 반도체기업 엔비디아는 아예 AI에 최적화한 GPU를 개발해 시장을 독점하다시피 하고 있다. KISTI도 예타 조사 당시 GPU 활용도가 높아질 것을 예상해 6호기 슈퍼컴퓨터의 성능 비율은 GPU 98%, CPU 2%로 설정했다. 5호기는 CPU 기반으로만 운영됐다.

젠슨 황 엔비디아 최고경영자(CEO)가 5월 대만 타이베이에서 열린 '컴퓨텍스 타이베이 2023 전시회'에서 자사 신제품을 소개하고 있다. 타이베이=로이터 연합뉴스

문제는 GPU의 가격이 고공행진을 하고 있는 데다, 생성형 AI인 챗GPT 열풍 이후 'GPU 사재기' 현상까지 벌어지고 있다는 것이다. 현재 전 세계 슈퍼컴퓨터에 널리 장착되는 엔비디아 반도체는 A100과 H100으로, GPU 1개당 가격이 수천만 원을 호가한다. 엔비디아의 반도체를 생산할 수 있는 파운드리(반도체 제조 전문기업)도 대만의 TSMC가 유일한 데다 세계적인 인공지능 열풍으로 물량이 부족하다 보니, 주문하고 물건을 받는 데만 1년 가까이 소요되는 것으로 알려졌다. 또다른 GPU 생산업체인 AMD가 엔비디아의 유일한 대항마로 거론되고 있다.

KISTI는 사실상 'GPU 대폭 할인'에 기대를 걸고 있다. 예타 조사를 통과한 슈퍼컴퓨터 구축 예산 2,929억원과 600페타플롭스 성능은 바뀔 수 없는 '독립 변수'이기 때문이다. 600페타플롭스의 성능을 내려면 약 8,000~9,000개의 GPU와 3,000여개의 CPU가 장착돼야 하는데, 현재 GPU 시세(약 3,000만원)만 따져봐도 슈퍼컴퓨터 6호기의 컴퓨터 구축 비용(2,104억원)을 훌쩍 넘기게 된다. 레노버, 크레이 등 슈퍼컴퓨터를 구축하는 업체들이 얼마나 할인된 가격에 부품을 구입하는지가 관건인 셈이다. 통상 국가가 운영하는 슈퍼컴퓨터에 반도체 등 부품을 납품할 경우 막대한 마케팅 효과를 누릴 수 있다는 점도 KISTI가 희망을 걸고 있는 부분이다. 이식 KISTI 국가슈퍼컴퓨팅본부장은 "1, 2차 입찰에 나선 기업이 없는 만큼, 3차 입찰에선 컴퓨터의 전체 성능에 영향을 미치지 않는 선에서 세부 항목 등을 조정했다"고 설명했다.

KISTI 슈퍼컴퓨터 6호기 예산안. 그래픽=박구원 기자

6호기 도입 지연에...애타는 과학자들

애초 내년 말 정식 서비스가 시작될 것으로 예상됐던 슈퍼컴퓨터 6호기 구축이 지연되면서 슈퍼컴퓨터를 활용해 연구를 하던 과학자들은 답답한 심정을 드러냈다. 컴퓨터 시뮬레이션을 통해 가상의 우주를 구현하고 은하 연구를 진행했던 신지혜 한국천문연구원 은하진화그룹 선임연구원은 "6호기에 어떤 회사의 GPU가 장착되느냐에 따라 쓸 수 있는 컴퓨터 언어가 달라지고 그에 맞는 전략을 준비할 수 있는데, 발만 동동 구르고 있는 상황"이라고 말했다.

한국과학기술정보연구원(KISTI)의 슈퍼컴퓨터 5호기 '누리온' 모습. KISTI 제공

슈퍼컴퓨터 5호기를 활용해 단백질 사이의 상호작용을 예측하는 AI를 학습시키고 있는 백민경 서울대 생명과학부 교수는 "5호기를 사용할 때도 GPU를 쓸 수 있는 기회가 적어 일주일치 연구를 이틀 단위로 쪼개 여러 번 진행한 적이 있다"면서 "인공지능을 학습시키려면 GPU는 필수 자원인데, 6호기 도입이 지연될수록 관련 연구들도 느려질 수밖에 없다"고 꼬집었다. 5호기로 실시간 도심 바람 환경 시뮬레이션 연구를 수행해온 최정일 연세대 계산공학과 교수는 "인공지능과 디지털 트윈 기술(가상공간 구현을 통한 모의실험) 등이 발달함에 따라 GPU 기반의 계산, 예측 기술 수요가 크게 늘었다"면서 "미국의 물가 상승, 고환율 등 예측하지 못한 외부 요인이 발생했지만, 슈퍼컴퓨터는 시의적절하게 구축될 필요가 있다"고 강조했다.

KISTI 슈퍼컴퓨터 5호기 인공지능 과제 신청 건수. 그래픽=박구원 기자

전기료만 연 150억... 슈퍼컴 예산은 증액?

결국 슈퍼컴퓨터가 맞닥뜨린 위기는 기술 발전과 시장의 흐름, 경제 상황 변화 등을 면밀히 예측해 제때 예산에 반영하지 못한 데 근본적인 원인이 있다. 다행히 6호기가 구축되더라도 '전기 먹는 하마'에 비유될 만큼 천문학적인 전기료를 감당해야 하는 것도 숙제다. 5호기에는 연간 50억원의 전기료가 들어갔는데, 6호기는 그 3배에 달하는 연간 150억여 원이 들 것으로 예상된다.

하지만 정부가 내년 연구개발(R&D) 예산을 대규모 삭감하겠다고 예고한 마당이라 안정적인 운영이 가능할지 미지수다. 지난달에는 KISTI 국가슈퍼컴퓨팅본부의 대용량데이터허브센터가 전기요금 인상에 따라 한시적 셧다운을 하기도 했다. 홍태영 KISTI 슈퍼컴퓨팅인프라센터장은 "내년도까지는 슈퍼컴퓨터 6호기 운영을 위한 예산이 확보된 상황"이라면서도 "전기료가 인상되면 내후년부터는 예산 증액이 필요할 수도 있다"고 설명했다.

이현주 기자 memory@hankookilbo.com

Copyright © 한국일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?