"사내 생성형AI, 모던 데이터 플랫폼 마련 선행돼야"

팽동현 2023. 8. 9. 18:51
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

장성우 오라클 전무 데이터 강조
"데이터 흘러야 AI 학습도 수월"
장성우 한국오라클 전무. 오라클 제공

"기업 경쟁력을 위해 자체 LLM(대규모언어모델) 마련을 고려한다면 먼저 사내 데이터부터 정리·관리돼야 한다. 데이터 거버넌스를 바탕으로 클라우드까지 아우르도록 데이터 메시를 반영하고, 데이터레이크하우스 도입도 검토할 필요가 있다."

장성우 한국오라클 전무는 최근 기자와 만나 '모던 데이터 플랫폼'의 필요성을 강조하며 이같이 밝혔다. 한국오라클에서 오랫동안 DB(데이터베이스) 관련 사업을 지원해온 그의 눈에도 생성형AI가 지닌 잠재력이 심상찮아 보이지만, 기업들이 이를 자체적으로 마련하기 위한 기반이 충분히 다져지지 않았다는 평이다.

챗GPT를 비롯해 올해 들어 생성형AI가 세계적 화두로 떠올랐지만, 그럴듯한 거짓을 지어내는 할루시네이션(환각) 문제와 개인정보·기밀정보 유출 우려도 여전히 지적된다. 이에 유수의 기업들 중심으로 생성형AI의 기반이 되는 LLM을 사내 구축하려는 시도가 이어지고 있다. 기업 고유 데이터 추가학습과 사용목적에 맞춘 미세조정(파인튜닝)을 거쳐 산업분야나 전문영역에 특화, 정확도·활용도를 높이면서 보안 관련 문제 해결도 꾀하는 것.

이를 위한 선결과제는 '데이터 거버넌스'다. 각 부서와 계열사 및 해외 사업장 등에서 무슨 데이터가 어디서 어떻게 수집·처리되는지, 학습에 쓸 것과 쓰지 않을 것은 무엇인지 등이 담긴 관리체계가 경영진 의지와 함께 정립돼야 한다.

특히, 규모가 있는 기업이라면 이를 바탕으로 필요한 데이터가 조직이나 IT인프라에 관계없이 흐를 수 있는 IT시스템을 마련하는 것도 요구된다. 멀티·하이브리드 클라우드 환경에 산재된 데이터에 대한 접근성·일관성을 확보하려면 데이터 가상화 기반 '데이터 메시' 아키텍처가 전제되고, '베스트 오브 브리드'로 시스템을 구성하기 위해서도 필요하다는 게 장 전무의 설명이다.

'데이터 메시' 관련해 장 전무는 "많은 기업들은 자체 LLM 구축에 필요한 요소도 이미 상당부분 보유했다. 단지 데이터가 갇혀있을 뿐"이라며 "OCI(오라클 클라우드 인프라)가 추구하는 '모던 데이터 플랫폼'은 실시간으로 연결돼있어 필요한 곳에 바로 데이터를 보내줄 수 있도록 구성된 클라우드 기반 엔드-투-엔드 데이터 관리 시스템"이라고 소개했다. 데이터 동기화와 스트림 데이터 처리를 지원하는 대표적인 CDC(변경데이터캡처) 솔루션 'OGG(오라클 골든게이트)'도 오라클이 지닌 강점이다.

오라클은 '데이터 메시'를 구현할 IT인프라로 기존 DW(데이터웨어하우스)와 데이터레이크를 아우른 클라우드 기반 '데이터레이크하우스'를 앞세운다. '오라클 엑사데이터'가 대표적으로, 어플라이언스 제품과 동일한 기능을 서비스형으로도 제공한다. DB시장을 선도해온 오라클 DBMS(DB관리시스템) 기능을 포함해 OLTP(온라인 트랜잭션 처리)와 OLAP(온라인 분석 처리)이 일원화돼 데이터 전반을 다룰 수 있고, 기업 니즈에 따라 ADB(자율운영DB) 방식으로 필요한 자원만큼 쓸 수도 있다.

스노우플레이크, 데이터브릭스 등 데이터레이크하우스 기업들과의 차별점에 대해 장 전무는 "데이터 수집·저장·분석과 AI엔지니어링까지 전 과정을 일관되게 제공한다. DB 데이터와 빅데이터가 긴밀하게 결합 가능한 구조에 '엑사데이터' 특유의 하드웨어적 성능도 뒷받침된다"며 "사용량이 늘어날수록 비용 효율에도 강점을 지닌다. 최근 엑사데이터의 스토리지 서버 비용도 오브젝트 스토리지와 비슷한 수준으로 낮췄다"고 말했다.

오라클은 오픈AI의 대항마로 평가받는 코히어와 B2B 생성형AI 제공을 위한 파트너십을 체결했고, 엔비디아의 AI 슈퍼컴퓨팅 서비스 'DGX클라우드'도 OCI를 통해 제공하는 등 적극적인 행보를 이어가고 있다. 엔비디아 A100 GPU(그래픽처리장치)가 3만2768개 연결된 슈퍼클러스터를 마련했으며, 기업고객 사내 데이터센터 등에 프라이빗클라우드 형태로 GPU 등 자원을 OCI와 동일한 구성으로 빌려주는 전용(Dedicated) 리전 서비스도 활성화되고 있다. 장 전무는 "국내 제조분야 대기업에서 ADB 기반으로 데이터레이크하우스를 구축하는 프로젝트도 진행하고 있다. GPU 관련 요청도 꾸준히 이어지고 있다"며 "모든 데이터를 잘 다룰 수 있는 효과적인 플랫폼을 구축하는 기업이 미래 승자가 될 것으로 보인다. 고객이 효과적·효율적으로 이를 달성할 수 있도록 찾아가는 PoC(개념검증) 등을 통해 꾸준히 지원할 것"이라고 덧붙였다.팽동현기자 dhp@

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?