최대 성능 11배 향상된 PIM 반도체 나왔다

국내 연구진이 기존 시스템 대비 성능이 최대 11배 향상된 프로세싱-인-메모리(PIM) 반도체를 개발했다. PIM 반도체가 통신할 때 PIM 반도체 외부로 연결되는 중앙처리장치(CPU)를 통과하면서 발생하는 병목현상을 해결했다. 인공지능(AI) 및 빅데이터 응용 분야에서 PIM 반도체 활용성 향상에 기여할 것으로 기대된다.
KAIST는 김동준 전기및전자공학부 교수 연구팀이 미국 노스이스턴대, 보스턴대, 스페인 무르시아대의 연구진과 공동연구를 통해 ‘PIM 반도체 간 집합 통신에 특화된 인터커넥션 네트워크 아키텍처’를 통한 공동연구로 PIM 반도체의 통신 성능을 비약적으로 향상하는 기법을 개발했다고 19일 밝혔다.
연구팀은 기존 PIM 반도체의 메모리 내부 연산 장치 간 통신 구조의 한계를 밝혔다. 메모리 내부에 존재하는 데이터 이동을 위한 구조를 최대한 활용하면서 각 연산장치를 직접적으로 상호 연결하는 ‘인터커넥션 네트워크 구조’를 적용해 PIM 반도체의 통신 성능을 극대화하는 기법을 제안했다. 인터커넥션 네트워크는 다중 연산 장치를 포함하는 대규모 시스템 설계에 쓰이는 연산 장치 간 연결 구조다.
연구팀은 인터커넥션 네트워크를 통해 PIM 반도체를 위한 연산 과정 중 통신 처리와 관련된 CPU의 개입을 최소화했다. 이어 PIM 반도체 시스템의 전체적인 성능과 활용성을 높인 PIM 반도체에 특화된 인터커넥션 네트워크 구조를 개발했다.

개발된 구조는 병렬 컴퓨팅과 기계학습 분야에서 널리 활용되는 집합 통신패턴에 특화됐다. 각 연산장치의 통신량과 데이터 이동 경로를 미리 파악할 수 있다는 집합 통신의 결정성 특징을 활용해 기존 네트워크에서 비용을 발생시키는 주요 구성 요소들을 최소화했다.
PIM 특화 인터커넥션 네트워크 구조를 적용한 PIM 반도체는 기존 시스템 대비 애플리케이션 성능이 최대 11배 향상됐다. PIM 반도체의 내부 메모리 대역폭 활용률을 극대화하고 PIM 메모리 시스템의 규모가 커지면서 통신 성능의 확장성이 함께 증가했기 때문이다.
김동준 교수는 “데이터 이동을 줄이는 것은 PIM을 포함한 모든 시스템 반도체에서 핵심적인 요소”라며 “PIM은 컴퓨팅 시스템의 성능과 효율성을 향상할 수 있지만 PIM 연산장치 간 데이터 이동으로 성능 확장성이 제약될 수 있어 응용 분야가 제한적인 만큼 PIM 인터커넥트가 이에 해법이 될 수 있다”고 연구의 의의를 설명했다. 연구 결과는 국제 학술대회 ‘2025 미국전기전자공학회(IEEE) 고성능 컴퓨터 아키텍처 국제 심포지엄’에서 3월 발표될 예정이다.
[박정연 기자 hesse@donga.com]
Copyright © 동아사이언스. 무단전재 및 재배포 금지.