‘대형 AI서버’ 성능·효율 사전 검증…KAIST, ‘가상 AI 실험장’ 개발

구본혁 2026. 5. 29. 08:26
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

- 전산학부 박종세 교수팀, AI 반도체·LLM 시스템 실험 인프라 시뮬레이터 개발
컴퓨터 시스템 성능 분석 분야 국제학회 ‘ISPASS 2026’에서 최우수 논문상을 수상한 박종세(왼쪽 끝) KAIST 교수 연구팀.[KAIST 제공]

[헤럴드경제=구본혁 기자] 국내 연구진이 대규모 AI 서버 구축 전에 성능과 효율을 사전에 예측할 수 있는 통합 시뮬레이터 기술을 개발했다. 이를 통해 AI 인프라 개발 비용과 시간을 크게 줄일 수 있을 것으로 기대된다.

KAIST는 전산학부 박종세 교수 연구팀이 개발한 거대언어모델(LLM) 서비스 인프라 시뮬레이터(simulator·가상 실험 소프트웨어) 연구가 컴퓨터 시스템 성능 분석 분야 국제학회 ‘ISPASS 2026’에서 최우수 논문상을 수상했다고 29일 밝혔다.

연구팀이 개발한 ‘LLMServingSim 2.0’은 복잡한 AI 서비스 환경에서 다양한 하드웨어와 소프트웨어 조합을 가상으로 분석할 수 있는 시뮬레이션 플랫폼이다. 연구자와 개발자들은 값비싼 대규모 서버 인프라를 직접 구축하지 않고도 다양한 설계안을 자유롭게 실험하고 성능을 검증할 수 있다.

‘LLMServingSim 2.0’ 모식도.[KAIST 제공]

이 기술은 기존 그래픽처리장치(GPU) 중심 환경을 넘어 차세대 AI 반도체로 주목받는 신경망처리장치(NPU)와 프로세싱 인 메모리(PIM) 등 다양한 하드웨어 환경을 지원한다.

반도체와 AI 가속기 기업에서는 새로운 NPU, PIM 기반 메모리 장치와 같은 차세대 하드웨어가 실제 LLM 서비스 환경에서 어느 정도 효과를 낼 수 있는지 빠르게 검증하는 도구로 사용할 수 있다.

또한 실제 AI 서비스 운영 과정에서 발생하는 데이터 처리, 요청 분배, 메모리 활용 등 복잡한 동작을 시스템 수준에서 재현해 현실에 가까운 성능 평가가 가능하다. 특히 여러 서버 자원을 분리·연결해 사용하는 분산형(disaggregated) 인프라 환경까지 분석할 수 있어 차세대 AI 데이터센터 연구에도 활용 가능성이 크다.

박종세 교수는 “현재 대규모 LLM 서빙 시스템을 직접 구축하고 실험하려면 많은 GPU, 서버, 네트워크 장비가 필요하고, 새로운 하드웨어를 검증하려면 더 큰 비용과 시간이 필요하다”면서 “이 시뮬레이터가 연구자와 산업계가 차세대 AI 인프라를 더욱 빠르고 효율적으로 개발하는 데 중요한 기반이 될 것”이라고 말했다.

Copyright © 헤럴드경제. 무단전재 및 재배포 금지.