[미래기술25]홍수처럼 쏟아지는 데이터 모아 AI분석, 인간의 생각까지 예측하죠

정다슬 2022. 10. 31. 02:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

ICT기술 발전과 함께 급속도로 쌓이는 데이터
빅데이터 분석을 위한 'AI'…학습 위해서도 빅데이터 필요
'플랫폼 기업화' 선언한 LG유플, 개인정보 불법수집 철퇴맞은 구글·메타
빅데이터 수집 능력 확대하기 위한 기업들의 생존경쟁 거세
[이데일리 이미나 기자]
[이데일리 정다슬 기자]1854년 플로렌스 나이팅게일은 자원봉사자 38명과 터키의 영국군 야전병원으로 갔다. 거기서 그녀는 깜짝 놀랐다. 야전 병원의 많은 환자가 전장에서의 부상이 아닌 야전병원에서 다른 질병에 감염돼 죽었기 때문이다. 나이팅게일은 이 사실을 ‘객관적으로’ 파악할 필요가 있다고 생각했다. 간호학이라는 학문이 제대로 정립되기도 전에 그녀는 세계 최초로 외무기록표를 만들어 입원환자 진단(부상내용), 치료내용, 추가 질병 감염 여부, 치료 결과(퇴원 또는 사망) 등을 매일 꼼꼼하고 이를 월별로 종합했다. 그리고 이를 시각적으로 나타낸 하나의 다이아그램을 고안했다.
나이팅게일이 터키 영국군 야전병원의 상황을 알리기 위해 사용한 다이아그램.
그림에서 검은색은 전장에서 입은 상처로 사망을, 연한 회색은 예방이 가능했던 병원 감염으로인한 사망을 나타낸다. 나이팅게일이 제시한 그림은 감염 예방을 위한 위생 개혁의 중요성을 나타냈고, 영국신문은 이를 대대적으로 보도했다. 사람들은 부상군인이 병원에서 치료되기는커녕 오히려 병을 얻어 사망한다는 사실에 경악했고 정부는 서둘러 특별조사단을 파견했다.

나이팅게일의 사례는 데이터 분석의 중요성과 함께 데이터란 언제 어디서나 존재하던 것이었고 언제나 중요했던 것임을 새삼 느끼게 해줍니다. 데이터를 수집하고, 분석하고, 인사이트를 이끌어내는 작업은 그야말로 인류사의 발전동력이었던 셈이지요.

달라진 점이 있다면 정보통신 기술(ICT)이 발전하면서 이 공기처럼 떠다니던 데이터를 수집하는 것이 더 쉬워졌다는 것입니다. 과거에는 일일이 적어서 기록해야 했던 데이터들이 이제 고도화된 시스템을 바탕으로 축적됩니다. 이뿐만일까요. 온종일 스마트폰으로 주고받는 수많은 메시지부터 인터넷 쇼핑과 사회관계망서비스(SNS), 인터넷 검색, 주식거래나 신용카드 결제 등을 바탕으로 우리의 데이터는 실시간으로 쌓이고 있습니다.

코앞으로 훌쩍 다가온 사물인터넷(IoT) 시대에는 사람뿐만 아니라 물건들이 실시간으로 소통하며 데이터를 생성하고 있습니다. 여기에 사물에 달린 각종 센서 등은 그간 데이터로 만들기 어려웠던 것들도 데이터화합니다. 수면패턴, 운동 횟수, 운동 강도 등등이지요.
만들어지거나 복사 된 데이터량 추이. 2010년~2020년은 각종 간행물을 바탕으로 측정됐으며 2021년부터 2025년 값은 이전 추정치 등을 반영해 연간 23%씩 성장한다고 가정한 추정치이다. (출처=스테티스타)
미국의 데이터분석기업 스테티스타에 따르면 2021년 생성된 데이터양은 79제타바이트(1조 기가바이트)라고 합니다. 이는 지구에서 태양까지 6번 왕복할 수 있는 숫자입니다. 2025년이 되면 이 데이터양은 181제타바이트까지 늘어날 전망입니다.

감당하기 어려운 빅데이터를 분석하기 위해 인간은 늘 그랬듯 또 다른 도구를 찾아냅니다. 바로 인공지능(AI)입니다. AI는 걷고, 보고, 느끼고, 의사소통과 같은 일상적 행위는 잘 못하지만 반대로 수학적 계산, 논리분석 등은 쉽게 구현합니다. 게다가 AI는 사람이 따라잡을 수 없는 빠른 속도로 학습을 해냅니다. 빅데이터와 AI가 무관하지 않은 이유이지요.

2022년과 1854년의 또 하나의 차이점은 이 같은 빅데이터의 활용 여부가 향후 기업의 생존을 좌우할 것이란 점입니다. 빅데이터를 얼마나 잘 활용하느냐에 따라 현실을 파악(데이터 탐구)하고 문제점을 감지하며(이상 탐지), 향후 어떤 일이 일어날 것인지(예측)하는 능력이 크게 차이가 날 것이기 때문입니다. 아울러 이를 분석(인공지능, 모델링)하고 최선의 대응을 도출(실시간 대응)하며 자신이 원하는 상황을 유도하려고 필요한 조치(개인화 추천, 최적화)하는 것 역시 기업의 대응능력을 좌우합니다.

최근 LG유플러스는 라이프스타일과 놀이, 성장케어, 웹3.0을 내세운 4대 플랫폼 전략을 중장기적인 성장전략으로 발표했습니다. “고객이 어디서 시간을 보내는지는 알고 있지만, 무엇을 하면서 시간을 보내는지는 알지 못했다” 이 한 마디는 LG유플러스가 플랫폼 사업 성장에 대한 강한 의지를 나타내는 이유를 보여줍니다. 황현식 LG유플러스 대표는 “통신은 고객의 시간을 많이 점유하는 서비스지만 실제 고객 지향적인 서비스를 제공하고 이해하는 것은 크고 작은 플랫폼 회사들에 뺏겼다. 지금부터 고객 중심 사업으로 무장해 서비스를 만들고 이를 기반으로 확장하는 플랫폼을 키우기로 했다”고 말했습니다.

황현식 LG유플러스 대표(CEO)가 15일 서울 중구 앰베서더서울풀만 호텔에서 LG유플러스의 4대 플랫폼 전략에 대해 설명하고 있다. (사진=LG유플러스 제공)

이처럼 빅데이터에 사활을 건 기업들은 고객들을 점점 자기 서비스 생태계로 포섭하려는 락인(Lock in) 전략을 구사하고 있습니다. 우리는 편리하게 구글·네이버·메타 등이 제공하는 빅테크들의 서비스를 사용하지만, ‘세상에 공짜는 없다’라는 말처럼 그 안에서 우리가 하는 행동은 데이터로 쌓여 그 기업들의 이익 추구에 쓰이는 것이지요.

그런가 하면 최근 개인정보보호위원회는 이용자의 동의 없이 개인정보를 수집해 온라인 맞춤형 광고에 활용하는 등 개인정보보호법을 위반한 구글과 메타에 약 1000억원의 과징금을 부과했습니다. 구글과 메타가 자신의 서비스에 가입한 이용자들이 자신의 서비스를 이용할 때뿐만 아니라 타사 서비스를 이용할 때의 정보도 수집해 맞춤형 광고에 활용해왔고, 이 과정에서 제대로 이용자에게 동의를 받지 않았다는 혐의입니다.

물론, 구글과 메타는 제대로 된 동의를 받았다며 반발하고 있지만 이 같은 상황은 기업들이 돈이 되는 데이터 수집을 위해 얼마나 위법과 편법을 오가며 자신의 사활을 거는지 보여줍니다.

정다슬 (yamye@edaily.co.kr)

Copyright © 이데일리. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?