[이상근의플랫폼경제] ‘데이터 댐’의 부영양화

2022. 11. 17. 23:08
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

지난 정부에서 추진한 '정부3.0'은 공공부문의 데이터 공개 및 전 부처의 전산화 완료라는 업적을 남겼지만 아직 해결하지 못한 과제도 존재한다.

그 대표적 정책이 '데이터 댐' 프로젝트다.

2020년 하반기 본격적으로 시작한 데이터 댐의 7대 핵심 사업은 인공지능(AI) 학습용 데이터 구축, AI 바우처, AI 데이터 가공바우처 사업, AI 융합 프로젝트, 클라우드 플래그십 프로젝트, 클라우드 이용바우처 사업, 빅데이터 플랫폼 및 센터 구축이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

개인정보 유출·플랫폼 기업 독점 등 폐해 속출
리소스 통합 관리 ‘데이터 패브릭’ 대안 부상
지난 정부에서 추진한 ‘정부3.0’은 공공부문의 데이터 공개 및 전 부처의 전산화 완료라는 업적을 남겼지만 아직 해결하지 못한 과제도 존재한다. 그 대표적 정책이 ‘데이터 댐’ 프로젝트다. 2020년 하반기 본격적으로 시작한 데이터 댐의 7대 핵심 사업은 인공지능(AI) 학습용 데이터 구축, AI 바우처, AI 데이터 가공바우처 사업, AI 융합 프로젝트, 클라우드 플래그십 프로젝트, 클라우드 이용바우처 사업, 빅데이터 플랫폼 및 센터 구축이다. 데이터 댐 사업을 통해 보다 많은 새로운 일자리 창출, 타 분야와의 융합 가속화, 국내 산업 경쟁력 제고 등이 기대됐다.

문제는 데이터 수집에는 성공했으나 데이터 쌍방연결은 제대로 이뤄지지 않았다는 점이다. 공공부문에서 기상청의 기상정보나 도로공사의 차량정보들은 민간과의 공유를 통해 다양한 기상산업과 교통 관련 산업의 새로운 생태계를 형성한다. 하지만 민간 사업자의 경우 프라이버시나 법률적·사업적 이유를 들어 데이터 개방과 공유에 소극적이다. 민간의 이용자 개인정보 유출은 사회적 문제로 대두되었고, 플랫폼 기업의 사용자 데이터 독점에 따른 폐해가 속출하였다. 초기 의도와 달리 민간기업은 이익이 될 때만 데이터를 개방하거나 공유하는 경향이 강했다. 민간 사업자들은 데이터 댐에 저질 데이터를 공유함으로써 데이터 댐을 오염시켜 부영양화를 초래하기도 했다. 데이터 댐이 ‘데이터 늪’으로 악화한 것이다.

이미 많은 매체는 데이터 댐의 실패 가능성을 언급했다. 월스트리트저널은 올해 6월 데이터 프라이버시 룰이 양질의 데이터 공유를 어렵게 만듦을 지적했고, 앞서 2020년 8월에도 실시간 데이터 공유에 회의감을 표시했다. 다보스포럼의 2021년 10월21일자 보고서는 전통적 방법의 의료 데이터 수집이 대중의 저항을 초래할 것이라고 했다.

이러한 문제점을 해결하기 위해 등장한 개념이 ‘데이터 패브릭’(Data Fabric)이다. 이는 직물처럼 교차되어 엮어진 연결망의 특성에서 따온 이름이다. 엑셀파일, 데이터 레이크, 웹서비스 데이터, 빅데이터, 레퍼런스 데이터, 클라우드 데이터와 같이 다른 리소스들을 하나의 플랫폼으로 통합시키고 관리를 단순화하는 방법이다. 분산 네트워크 환경에서 원활한 데이터 접근 및 공유를 지원하기 위해 여러 데이터 관리기술이 작동하는 형태로 설계됐다. 궁극적으로는 데이터 통합검색을 통해 데이터 활용성을 제고하고 비즈니스의 가치 창출을 강화하기 위한 새로운 전략이다.

공공기관과 민간기업 모두 증가하는 데이터를 효율적으로 관리해야 하는 만큼 향후 데이트 패브릭은 더욱 중요해질 것이다. 데이터 댐 프로젝트로 인해 데이터의 질(양질/저질), 형태(정형/비정형), 규모(대/소)와 상관없이 모두 한 공간에 저장하게 되었다. 각기 다른 요구사항을 가진 비즈니스 부서로의 효율적인 데이터 공급이 힘들어졌고, 방대한 데이터 관리에 막대한 시간과 비용이 요구된다. 따라서 데이터 패브릭이 성공하려면 데이터 댐으로 들어오는 데이터를 1차로 정제해 ‘오염수’ 진입부터 막아야 할 것이다. 또 확장 가능한 플랫폼으로 통합시켜 데이터 저장공간과 상관없이 클라우드 상태에서도 쉽게 데이터에 접근하고 이동이 가능한 환경을 제공해야 할 것이다. 정부 역시 방대한 데이터의 자산화에 적극적인 관심을 가져야 한다.

이상근 서강대 게임·평생교육원장

Copyright © 세계일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?