[기고]디지털 트랜스포메이션 시대를 주도하는 ‘통합 AI 플랫폼’

2023. 1. 25. 15:02
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

성능 최적화·연산 자원·저장 자원의 완벽 조화 필요

디지털 트랜스포메이션(DX) 시대를 맞아 AI(인공지능)가 조직 운영의 필수요소로 떠오르고 AI를 비즈니스에 적용하려는 기업들이 증가하고 있다. 많은 기업들이 AI/ML(머신러닝) 기반 자동화 프로세스를 단순 반복 업무에 도입하는 한편, AI를 전체 업무에 확장하기 위한 투자도 늘고 있다. 성공적인 AI 도입을 위해서는 소프트웨어, 하드웨어, 서비스 등 AI 기반이 되는 플랫폼을 구현하면서 자사 환경에 맞는 최적의 방향을 설정해야 한다.

떠오르는 AI 플랫폼 시장

데이터 시대가 열리면서 AI는 고객의 새로운 경험에 큰 영향을 미치는 혁신적이고 효과적인 기술로 진화하고 있다. 특히 팬데믹 상황으로 비대면 업무가 활성화되면서 AI 기술 도입은 제조업, 서비스업을 중심으로 전 산업계로 빠르게 확산됐다.

시장조사 전문기관 IDC가 지난 2022년 3월에 발표한 자료에 따르면 국내 AI 시장은 향후 5년간 연평균 15.1% 성장률로 2025년 1조9074억원 규모에 달할 전망이다. AI 시장을 서비스, 소프트웨어, 하드웨어 부문으로 구분할 경우 그 비율은 30:40:30으로 추정되며, 2022년 AI 하드웨어 인프라 시장 규모만 3363억원에 달한다.

가파른 시장 성장 전망과 함께 AI를 도입하려는 기업들의 움직임도 활발하다. 그러나 AI 플랫폼을 기반으로 원하는 성과를 거두기 위해서는 △인프라 성능 최적화 △한정된 GPU 자원의 효율적인 사용 방법 △구현된 AI 모델에 대한 지속적이고 효율적인 관리 등 여러 사항을 고려해야 한다.

최적의 AI 플랫폼 구축 전략

AI를 비즈니스에 적용하고 목적에 맞게 활용하기 위해서는 클라우드, 컨테이너, 가상머신, 빅데이터, AIOps 솔루션, 고성능 스토리지, 네트워크 등 많은 구성요소가 필요하다. 그리고 이는 비용, 업무 효율, 관리 측면의 큰 변화를 동반한다.

AI 플랫폼 도입 시 기업들의 고민

기업들은 한정된 GPU 연산 자원의 효율적인 사용과 분석, 대량의 데이터 저장 방법 등 가용성을 높일 수 있는 방법을 끊임없이 고민하고 있다. 전통적인 인프라 환경에서 AI 모델을 개발하고 효율적으로 운영하는 일은 쉽지 않다. 강력한 GPU 서버만 도입한다고 성능이 개선되지는 않는다.

따라서 GPU 기반 데이터 연산부터 고성능 컴퓨팅에 최적화된 스토리지를 활용한 대용량 데이터 저장과 자동화된 관리, 그리고 쉬운 운영 환경에 이르는 전천후 솔루션 역할을 담당하는 ‘통합 AI 플랫폼’이 주목받고 있다.

통합 AI 플랫폼은 최적화된 성능의 GPU 서버와 AI 모델 운영 관리 시스템을 결합하고 성능∙자원 효율, 운영 관리를 최우선으로 고려해 기업의 니즈 및 운영 환경에 적합하도록 맞춤형 솔루션을 제공한다. AI 플랫폼이 최적의 성능을 발휘하려면 △성능 최적화 △연산 자원 △저장 자원의 세 가지가 완벽한 조화를 이뤄야 한다.

GPU 서버 리소스가 충분하다고 성능을 최적화할 수는 없다. 대형 AI 모델의 학습 성능을 높이기 위해서는 GPU 연산 및 저장 자원의 성능과 함께 I/O 성능 최적화가 매우 중요하다. GPUDirect 기술을 통해 CPU와 CPU 메모리로 인한 병목 현상을 제거함으로써 데이터 프로세스를 개선하고, GPU 서버의 최대 성능 대역폭 I/O 처리가 가능해 성능 최적화를 이룰 수 있다.

AI 분석 환경에서 간과하면 안 되는 부분이 바로 스토리지 성능이다. 기존 NFS기반 NAS의 I/O는 속도에 한계가 있어 반드시 고성능의 데이터를 경제적으로 운영할 수 있는 초고성능 병렬 파일 시스템이 필요하다.

효성인포메이션시스템의 HCSF(Hitachi Content Software for File)는 엔비디아의 인증 GPU 서버와 함께 GPUDirect 스토리지 구성을 통해 저장 성능을 최적화한다. 특히 HCSF는 오브젝트 스토리지와 연계하기 때문에 비용효율적으로 운용할 수 있으며, 정책 기반의 티어링 파일 시스템 운영으로 비용대비 높은 성능과 용량 구성이 가능하여 AI분석 데이터 저장으로 최적의 성능을 보장한다

효성 AI 플랫폼의 강점

기업별 맞춤 솔루션으로 가치 극대화

기업별 환경에 맞는 통합 AI 플랫폼 제공을 위해 효성인포메이션시스템은 발빠른 행보를 보이고 있다. 효성인포메이션시스템은 'HPC사업팀'을 통해 고객이 통합 AI 플랫폼을 기반으로 AI를 업무에 활용해 최적의 가치를 창출하도록 지원하고 있다. 또한, 슈퍼마이크로, 래블업 등 전문 파트너사들과 협업해 로드맵 제안부터 수행, 유지보수까지 엔드 투 엔드 서비스를 제공한다.

HPC사업팀은 연산 처리를 담당하는 GPU와 네트워크, 저장장치로 구성되는 AI 하드웨어 플랫폼과 이를 운영∙관리하고 GPU를 가상화해 효율성을 높이는 PaaS 솔루션을 모두 제공한다. 구체적으로 AI 모델링이 필요한 사업들, 즉 AI와 ML 예측분석 업무를 위한 슈퍼컴퓨팅 사업, AI 클라우드 GPU 구축 사업, 데이터 레이크 연계 AI 업무용 GPU 서버가 필요한 고객들이 쉽게 AI를 도입하고 활용할 수 있는 최적의 방법을 제시한다.

송병진 효성인포메이션시스템 HPC사업팀 팀장

송병진 효성인포메이션시스템 HPC사업팀 팀장 his-bjsong@hyosung.com

Copyright © 전자신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?