[알아봅시다] 클라우드 환경에서 데이터 통합의 중요성

이형근 2016. 4. 20. 18:25
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

기업서 광범위 활용.. 내부데이터와 연동 수요 확산 클라우드 · 기업솔루션 함께 사용땐 데이터 복합성 늘어날 가능성 높아 기존 업무 클라우드로 전환할 경우 기업들 데이터 통합요구 증가날 듯

IT 환경과 업무가 변화하면서 데이터가 발생하고 소비되는 위치와 양이 변화하고 있습니다. 이에 따라 기업에서 데이터를 효율적으로 사용할 수 있도록 데이터 통합에 대한 요구가 증대되고 있습니다. 앞으로 빅데이터와 클라우드를 기반으로 새로운 기술들이 기업에 도입될 예정인데, 이 경우에도 데이터는 중요한 역할을 할 것으로 예상됩니다. 새로운 기술이 등장했을 때 데이터는 그 형태에 따라 활용도에 차이가 있습니다. 새로운 기술에 맞춰서 데이터를 변화 시켜야 한다면 데이터를 통한 가치 실현은 어려울 것입니다.

최근 IT업계는 급증하고, 다양화되는 데이터를 어떻게 정제하고 가공할지, 현재 기술 뿐 아니라 미래 등장할 기술에 쉽게 연동할 수 있는지 등 데이터 통합 부문에 대한 관심이 높아지고 있습니다. 과거 데이터 통합(Data Integration)은 기업 내 산재된 데이터를 DW(데이터웨어하우스) 등 하나의 통합된 저장소에 모아두고 분석하기 위한 일련의 과정을 말했습니다. 하지만 클라우드 환경이 중심이 되면서 데이터 통합이 더 복잡한 형태로 진행됩니다.

데이터 통합이란 IT 환경에서의 데이터 관리에 대한 기술적인 개념으로 여러 개의 데이터 소스들을 연계해 새로운 정보를 얻는 일련의 기술을 뜻합니다. IT 환경에서 통합(Integration)이라는 용어는 애플리케이션 통합(Application Integration)으로 변화했고 이어 현재는 클라우드 통합(Cloud Integration)을 포괄하는 의미로 확대되고 있습니다. 기업들은 데이터 간의 연계를 원활히 할 수 있는 데이터 통합 솔루션(Data Integration Solution)을 통해 데이터를 클라우드 환경에서 원활히 사용할 수 있도록 변환하고 있습니다.일부 기업들이 클라우드 도입을 통한 업무 혁신을 이루면서 클라우드로 전환하는 기업들이 많아지고 있습니다. 그러나, 데이터 연동과 보안 문제로 인해 클라우드를 운영환경으로 도입하는 데엔 여전히 주저하는 모습도 있습니다. 빅데이터 경우에는 다양한 형태 데이터를 통합해서 분석, 관리하기 위해 관련 기술들이 등장하고 있지만, 데이터 형태가 복잡해지면서 제대로 활용하지 못하는 일도 발생하고 있습니다.

클라우드로 이주를 계획하고 있는 기업들은 반드시 전사 차원에서 현재 기업 내에 구성된 IT 자원들과 클라우드가 어떻게 연동돼야 하는지 고민해야 합니다. 기존 기업 내 시스템들은 대부분 개별적으로 구축돼 데이터들이 업무와 부서에 따라 독립적으로 관리된 경우가 많습니다.

클라우드 경우에는 문제가 더 커집니다. 클라우드로 전환해도 데이터를 통합하지 않으면 데이터 고립 현상은 동일하게 발생합니다. 특히, 클라우드와 기업 내 자체 설치 솔루션을 함께 사용하는 경우 데이터 복잡성은 더 증가합니다.

기업들은 클라우드와 기업 내 시스템 간 장벽이 없는 하이브리드 클라우드 환경을 기대하지만, 실제로는 기대하는 업무보다 낮은 수준의 업무 개선이 진행될 가능성이 높습니다. 이에 데이터 통합(Data Integration)의 역할은 클라우드에서 더 중요해집니다.

기업들이 클라우드 환경을 선택해야 할 때도 데이터 연동 측면이 고려돼야 합니다. 클라우드 환경에서 데이터 통합은 인프라형 서비스(IaaS) 경우 운영체제(OS)와 OS 상에서 요구되는 솔루션을, 플랫폼형 서비스(PaaS)부터는 클라우드 업체에서 ETL(Extract, Transformation, Load)이나 CDC(Change Data Capture)와 같은 솔루션에 대한 기술을 확보하고 있다면 솔루션 자체를 클라우드 기반으로 변환해 제공하면 됩니다. ETL은 데이터 소스에서 필요한 부분을 추출하고 활용하기 용이한 형태로 변환해 DW 등 대상 시스템에 적재해주는 솔루션이며, CDC는 DBMS(DB관리시스템)에서 변경된 데이터만 포착해 옮겨주는 솔루션입니다. 만약 이같은 지원이 안된다면 자바(Java)나 닷넷(.Net)과 같은 인프라를 PaaS 형태로 제공해줘야만 클라우드 안에서 데이터 통합이 가능합니다.

클라우드 내의 애플리케이션 서비스 관점에서 데이터 통합은 대부분 응용 프로그래밍 인터페이스(API) 형태로 연동을 합니다. CDC를 통해 트랜잭션 수준으로 데이터를 복제하는 경우는 많지 않습니다. 하지만 만약 데이터베이스로의 접근에 대한 네트워크 환경, 접근 권한 그리고 데이터 구조가 주어진다면 CDC를 통해 실시간 데이터 통합이 가능하게 됩니다. 실시간 연동이 가능하다면 기업들이 더 높은 가치를 얻을 수 있습니다.

이 때문에 기업들이 사용하고 있는 오라클 클라우드 데이터베이스나 아마존 클라우드 서비스 혹은 마이크로소프트의 클라우드 서비스 같은 PaaS 형태의 데이터베이스 서비스들에 대해, 내부의 데이터와 연동하려는 요구는 증가할 것으로 예상됩니다.

데이터 통합에 대한 변화는 IT의 새로운 환경인 빅데이터, 클라우드, 기준이 바뀌고 있는 정보요구시간과 그에 따른 성능요구가 큰 흐름입니다. 하지만, 여기서 제공되는 데이터의 품질에 관해서도 생각해 봐야 합니다. 기존 데이터베이스 중심의 IT 환경은 품질의 문제가 높지 않았지만, 클라우드 환경에서는 데이터 활용도가 높은 만큼 복잡성은 증가했습니다.

앞으로 IT환경은 지금의 변화보다 더 큰 변화를 겪을 것입니다. 이에 기업들은 새로운 사업을 진행하거나, 기존 업무를 클라우드로 전환할 때 거시적인 차원에서 데이터 통합을 고려해야 합니다. 앞서 설명한 것처럼 데이터 활용이 광범위해지기 때문에 기존 데이터베이스 뿐 아니라 전략분석 솔루션, 빅데이터 영역까지 지원하는 환경을 구현하는 클라우드에 맞는 데이터 통합에 대한 요구가 증가할 것으로 전망됩니다.

이형근기자 bass007@

도움말= 한국오라클

▶이형근기자의 블로그 : http://blog.dt.co.kr/blog/?mb_id=bass007

< Copyrights ⓒ 디지털타임스 & dt.co.kr, 무단 전재 및 재배포 금지 >

Copyright © 디지털타임스. 무단전재 및 재배포 금지.