[기고] AI 시대의 데이터 관리원칙

최원식 스플렁크코리아 지사장 2025. 5. 22. 06:00
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

이미지투데이


오늘날 기업은 그야말로 데이터의 홍수 속에 살고 있다. 데이터가 넘쳐나지만 중요한 인사이트는 오히려 얻기 더 어렵다. 스플렁크와 옥스포드 이코노믹스가 지난해 11월부터 두 달간 전 세계 정보기술(IT)·엔지니어링·사이버보안 전문가 1475명에게 실시한 설문 결과에 따르면 응답자 67%는 가장 큰 과제로 데이터의 양과 속도를 꼽았다. 69%는 데이터 전략의 가장 큰 장애물로 보안과 규제준수를 지목했다.

이 설문의 응답자 57%는 직무·부서에 따라 데이터 접근권한을 구분하는 역할기반접근제어(RBAC) 정책을 마련하고도 실제로 운영하지 못한 것으로 나타났다. 79%는 데이터 삭제에 대한 명확한 기준이나 절차조차 갖추지 않았다.

제대로 된 관리 없이 무분별하게 쌓여 가는 데이터는 기업의 자산이 아니라 사이버공격과 법적책임을 유발하는 부담으로 작용한다. 고객 신뢰도와 평판에도 치명적인 타격을 입을 수 있지만, 많은 기업은 여전히 낡은 방식으로 데이터를 관리하는 실정이다. 중앙집중형 데이터 관리는 현실적 한계에 부딪힌지 오래고, 분산저장 방식은 데이터의 가시성과 통제를 잃게 할 수 있다.

인공지능(AI) 관점에서도 데이터 관리는 생명선과 같다. '콩 심은 데 콩 나고, 팥 심은 데 팥 난다'는 속담처럼 부정확하거나 편향된 데이터를 기반으로 학습한 AI는 기대와 전혀 다른 결론을 도출할 수 있다. AI가 조직의 경쟁력을 결정짓는 오늘날 고품질 데이터 없이는 그 어떤 AI 전략도 실효성을 갖기 어렵다.

그렇다면 기업은 데이터 관리를 어떻게 새로 정의해야 할까? 해답은 3가지 핵심 전략에서 찾는다.

첫째는 데이터를 물리적으로 이동하지 않고도 여러 위치에 흩어진 데이터를 통합적으로 접근해 분석할 수 있게 하는 '데이터 연합'이다. 분산된 데이터를 일일이 수집하고 옮기는 기존 방식보다 비용·시간 면에서 훨씬 효율적이고, 보안성과 규제대응력도 높다. 실제로 이 전략을 완전히 구현한 기업들은 평균 170만달러(23억6000만원)에 달하는 비용 절감 효과를 경험했다고 한다.

둘째는 데이터를 생성된 순간부터 저장·분석·보관·삭제까지 전 과정을 체계적으로 관리하는 '데이터 수명주기 관리'다. 특히 삭제는 단순한 정리가 아니라 보안과 규제준수를 위한 핵심 절차다. 사용기한이 지난 민감 데이터를 적절히 폐기하지 않으면 사이버 공격의 통로가 될 수 있다.

셋째는 '데이터 파이프라인 관리'다. 데이터를 실시간으로 수집·정제해 분석할 수 있는 상태로 가공하는 흐름을 자동화하는 전략을 말한다. AI 모델 훈련에 필수적인 것은 물론, 보안 위협을 탐지하고 대응하는 데도 매우 효과적이다. 데이터 파이프라인이 잘 갖춰져 있으면 이상 징후를 감지하는 즉시 관련 데이터를 신속하게 추출하고 대응할 수 있어 운영 효율성과 보안 민첩성을 동시에 확보할 수 있다.

데이터의 가치는 이제 단순한 저장에 그치지 않고 '어떻게 구조화하고 활용하느냐'에 달렸다. 조직은 데이터를 단순히 쌓아두는 데서 벗어나 분류·정리하며 필요한 순간에 쓸 수 있도록 준비하고, 모든 과정은 보안·거버넌스·AI 전략과 유기적으로 연결한 하나의 통합된 관리 체계 안에서 작동해야 한다. 데이터 관리에 대한 전면적 재설계가 필요하다.

최원식 스플렁크 코리아 지사장


최원식 스플렁크코리아 지사장

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.