㈜아크릴, 혁신적 RDMA 프레임워크 'PeRF' USENIX ATC에서 발표

고문순 기자 2024. 7. 15. 17:52
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

선도적인 인공지능 기업 아크릴(Acryl Inc.)의 AAAI 연구팀이 최신 논문 'PeRF: Preemption-enabled RDMA Framework'를 통해 RDMA 기술의 새로운 가능성을 제시하며, 캘리포니아 산타클라라에서 열리는 USENIX Annual Technical Conference (ATC)에서 발표했다.

㈜아크릴 이수기 박사가 RDMA 기술의 새로운 가능성을 제시함으로써 LLMOps 성능을 극대화 시킬 수 있는 ReRF 논문에 대해 설명하고 있다./사진제공=아크릴


USENIX ATC는 시스템 소프트웨어와 네트워크 연구 분야에서 최고의 권위를 자랑하는 학술대회로, 이번 발표는 아크릴의 연구 성과가 국제적으로 인정받는 중요한 계기가 될 전망이다.

기존 RDMA 기술은 단일 테넌트 환경에 최적화되어 다중 테넌트 클라우드 환경에서 성능 격리, 보안 및 확장성 문제를 해결하기 어려웠다. 아크릴의 PeRF는 이러한 한계를 극복하기 위해 설계되었으며, 소프트웨어 기반 성능 격리를 제공하는 Preemption-enabled RDMA Framework이다.

PeRF는 혁신적인 RNIC(RDMA NIC) 선점 메커니즘을 활용하여 각 테넌트의 RDMA 자원 사용을 동적으로 제어한다. 이를 통해 RDMA의 본래 성능을 유지하면서 유연한 성능 격리를 실현하고, 기존 방법보다 우수한 성능을 발휘한다. 특히 PeRF는 데이터 집중형 애플리케이션에 최적화되어 빅데이터 분석, 머신러닝, 분산 스토리지, 키-값 저장소 등 다양한 분야에서 활용될 수 있다.

최근 GPU 가격이 급등하면서 경제적인 GPU 활용이 중요한 이슈로 부각되고 있다. PeRF는 이러한 문제를 해결하는 데 큰 기여를 할 수 있다. PeRF는 RDMA 기술을 통해 GPU 자원의 효율적인 분배와 최적화를 가능하게 하여, 사용자는 적은 수의 GPU로도 최대의 성능을 발휘할 수 있다. 이를 통해 높은 비용의 GPU 구매 부담을 줄이고, 기존 GPU 인프라의 활용성을 극대화할 수 있다.

PeRF는 아크릴이 개발한 소프트웨어 기반 Multi-path RDMA 기술과 결합되어 더욱 큰 시너지 효과를 발휘한다. Multi-path RDMA 기술은 데이터를 여러 경로로 분산시켜 전송함으로써 네트워크의 효율성과 신뢰성을 극대화한다. PeRF와 결합하여 다중 테넌트 환경에서의 성능 격리와 자원 활용도를 한층 더 향상시킨다.

관계자에 따르면 이 결합은 특히 클라우드 기반 데이터 센터에서 다중 테넌트가 동시에 RDMA를 사용할 때 매우 유용하다. PeRF는 각 테넌트의 RDMA 사용을 실시간으로 모니터링하고, 필요에 따라 자원 할당을 조정하여 성능 격리를 보장한다. 동시에 Multi-path RDMA는 데이터 전송 경로를 최적화하여 네트워크의 효율성을 극대화한다. 이 두 기술의 결합은 클라우드 환경에서의 데이터 전송 속도와 안정성을 획기적으로 향상시킬 것이다.

PeRF의 성능 테스트 결과./사진제공=아크릴


아크릴의 주력 제품인 MLOps 및 LLMOps 플랫폼 '조나단(Jonathan)'에 PeRF를 적용함으로써, 조나단은 더욱 향상된 성능과 안정성을 제공한다. 이를 통해 조나단을 사용하는 고객들은 최적의 머신러닝 모델 운영 환경을 구축할 수 있으며, 대규모 언어 모델 운영에서도 뛰어난 성능과 효율성을 경험할 수 있다.

실제 성능 테스트 결과, PeRF는 기존의 성능 격리 기술들에 비해 월등한 성능을 보였다. 이번 연구는 염익준 박사가 리드하고 아크릴의 이수기 박사, 최민규 연구원, 그리고 성균관대학교의 김영훈 교수로 구성된 공동 연구팀에 의해 진행됐다. PeRF는 다중 테넌트 클라우드 환경에서 RDMA의 성능을 극대화하면서도 유연한 성능 격리를 제공할 수 있는 혁신적인 솔루션으로, 앞으로 다양한 데이터 집중형 애플리케이션에서의 활용이 기대된다.

주식회사 아크릴 AAAI 연구소장인 성균관대학교 염익준 교수는 "PeRF는 RDMA 기술의 한계를 극복하고 다중 테넌트 환경에서도 뛰어난 성능을 제공할 수 있는 혁신적인 솔루션이다. 이를 통해 MLOps 및 LLMOps 플랫폼 '조나단'의 성능과 안정성이 크게 향상될 것"이라고 전했다.

아크릴의 연구팀은 "이번 연구 결과를 바탕으로 더욱 발전된 RDMA 기술을 개발하고, 클라우드 컴퓨팅 환경에서의 활용을 확대해 나갈 계획"이라며 "이번 발표를 통해 많은 학계 및 산업계 관계자들이 PeRF와 조나단의 가능성을 확인할 수 있을 것"이라고 전했다.

고문순 기자 komoonsoon@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?