[와이파일] 온택트와 넷플릭스, 그리고 빅데이터
넷플릭스, 빅데이터 활용해 초기 기선 제압
'데이터 3법'에도 국내 빅데이터 산업 발전은 아직
"산업 발전과 개인정보 보호에 정치적 리더십 발휘해야"
코로나19 시대입니다. 언택트, 그러니까 비대면 시대인 만큼, 많은 분이 어려움을 겪고 있죠.
문화계와 미디어 업계도 온택트에 주목합니다. 대표적인 것이 바로 OTT 서비스입니다.
◆ 셋톱박스를 넘어선 'OTT'
OTT(Over The Top)가 뭘까요? Top, 그러니까 셋톱박스를 넘는다는 뜻이랍니다. 그럴 듯하죠? TV에 붙어있는 셋톱박스에서 벗어나 인터넷을 통해 어디서나, 언제든지 원하는 미디어에 접근할 수 있는 서비스입니다.
요즘 이 OTT 사용하시는 분 많을 겁니다. 편하게 미디어를 볼 수 있다는 장점에 더해 훌륭한 자체 제작 콘텐츠가 주목받고 있죠. 또, 코로나19 시대에 제때 개봉하지 못한 영화가 잇달아 OTT를 개봉 수단으로 택하면서 더욱 주목받는데요, 대표적인 OTT는 역시 넷플릭스고요, 여기에 웨이브, 왓챠, 아마존 프라임 비디오 등이 치열하게 경쟁하고 있습니다.
◆ '빅데이터'에서 나오는 넷플릭스의 강점
그런데 넷플릭스를 이용하다 보면 눈에 띄는 점이 있습니다. 바로 사용자에게 콘텐츠를 추천해준다는 점이지요. 아예 무작위 재생으로 사용자 취향에 맞는 영상을 틀어주기도 합니다. 추천 기능은 검색에서도 적극적으로 사용하는데요, 넷플릭스가 보유하지 않은 작품을 검색하면, 비슷한 성격의 콘텐츠를 추천해주는 방식이죠. 호불호는 갈리는 것 같던데요, 저는 일단 나름대로 만족하며 활용하고 있습니다.
넷플릭스는 빅데이터를 적극적으로 활용한다는 점으로 유명합니다. 추천은 물론이고 제작에도 써먹죠. 자체 제작 드라마(넷플릭스 오리지널)인 정치 드라마 '하우스 오브 카드'가 대표적인 사례입니다. 주목받을 만한 작품(하우스 오브 카드는 영국 소설이 원작입니다.)과 시청자가 좋아할 만한 연출자, 배우를 선정하는 데 빅데이터의 도움을 받은 것이지요. 결과적으로 대성공. 오늘날의 넷플릭스를 만드는 일등 공신이 됐습니다.
◆ '방대'하고 '다양'한 데이터를 '빠르게'
앞서 몇 차례 '빅데이터'라는 단어를 언급했습니다. 그렇다면 대체 빅데이터가 무엇일까요? 말 그대로 방대한 양의(BIg) 데이터(Data)입니다. 그 특징으로 흔히 '3V'를 꼽는데요, 바로 규모(Volume), 속도(Velocity), 다양성(Variety)을 말합니다.
◆ 무궁무진한 가능성의 '빅데이터'
빅데이터는 다양한 영역에서 활용됩니다. 직원 채용도 물론이죠. 유명한 것은 미국의 사무기기 제조 회사인 '제록스'입니다. 콜센터 직원을 선발하면 초기 교육비가 들어가겠죠.(=비용) 하지만 직원의 조기 퇴사율이 높아 고민하던 제록스는 이력서와 적성검사 데이터를 분석하기 시작합니다. 그 결과 특정한 성격 유형에 속하는 사람이나 집이 회사에서 먼 사람 등의 조기 퇴사율이 높다는 점을 발견했죠. 이를 이용해 신입 사원을 추려냈더니 조기 퇴사율이 20% 줄었다고 합니다. 사실 지금 거의 모든 기업이 진행하는 적성검사 역시 이런 측면과 유사합니다.
빅데이터는 인공지능, AI(Artificial Intelligence) 시대의 핵심이기도 합니다. 요즘 인공지능에는 주로 '기계학습'이라는 기법이 사용되는데요, 막대한 양의 데이터를 입력하고, AI가 이를 통해 문제를 해결하는 방법을 스스로 깨우치도록 하는 방법입니다. 우리에게 유명한 바둑 프로그램 '알파고' 역시 어마어마한 양의 바둑 기보를 통한 학습으로 바둑계에 파란을 일으켰습니다. 요즘은 아예 AI로는 구현하기 어렵다고 생각했던 예술 영역으로까지 차근차근 진출하고 있습니다.
◆ 가능성은 있지만…여전히 넘기 힘든 '벽'
빅데이터가 만든 시간과 공간의 제약이 사라진 개인화의 시대. 이 말만 들어도 빅데이터의 가능성이 어마어마할 것이라는 건 쉽게 예상할 수 있을 겁니다. 심지어 제한도 없습니다. 갈수록 더 많은 양의 데이터가 더 빠르게 만들어지니까요. 영토에 제한이 없는 셈이죠. 그런데 국내에선 여전히 빅데이터 산업이 걸음마 단계에 멈춰 있습니다. 규제가 가장 큰 걸림돌입니다.
규제 수위를 낮추는 데이터 3법이 국회 문턱을 넘기 전 한국은행 관계자를 만난 적이 있습니다. 이 분이 재미있는 말씀을 하시더군요. 내부에서 빅데이터 활용 방안을 찾고 있는데(한국은행에선 국내 경제와 관련한 다양한 통계를 집계합니다.) 쉽지 않다고. 개인정보 보호법에 막혀서 통계청으로부터 원본 자료를 받지 못한다는 겁니다. 국가 기관이 이런데, 민간 기업은 어떨까요. 지금은 데이터 3법이 통과됐지만, 글쎄요. 크게 상황이 달라진 것 같지는 않습니다.
최근 생명보험협회에서 기자간담회를 열었습니다. 정희수 협회장은 보험 상품 개발 등을 위해 공공 의료 데이터를 활용할 수 있도록 해달라고 호소했죠. 과거 보험사는 국민건강보험공단과 건강보험심사평가원이 가진 공공 의료 데이터를 받아 상품을 개발해 왔습니다. 하지만 2017년 이후 의료 데이터 제공이 중지됐죠. 데이터 3법이 처리됐지만, 아직 의료 데이터를 받아보진 못하고 있습니다.
데이터가 없다면 어쩔 수 없는 노릇이지만, 방대한 양의 데이터가 이미 국가 기관에 있어도, 규제의 벽에 막혀 여전히 잠에서 깨어나지 못한 셈이지요.
조성준 교수는 "데이터 3법 이후 빅데이터 활용이 예전보단 다소 개선됐지만, 여전히 현장에선 체감하기 어려운 경우가 많다"며 "가명화한 자료를 누가 관리하고 어떻게 가명으로 만드는지도 논란거리"라고 지적했습니다.
시민단체인 '규제개혁 당당하게'의 대표 활동가인 구태언 변호사는 "해당 산업이 제대로 시작하기 전에 적용됐던 사전 규제가 데이터 3법으로 어느 정도 해소됐다"면서도 "여전히 활용에 제약이 많아 이미 다량의 데이터를 보유한 대기업에 유리하고 스타트업은 불리한 구조가 고착화하진 않을지 우려된다"고 지적했습니다.
◆ "활용과 규제 사이의 절묘한 줄타기 필요"
다만 개인정보 보호의 중요성도 잊어선 안 되겠죠.
뉴욕타임스에 실렸던 기사를 인용해보겠습니다. 한 남성이 슈퍼마켓을 찾아 항의했습니다. 자신의 고등학생 딸에게 유아용품 할인 전단이 온 것이죠. 왜 고등학생에게 이런 전단을 보내 임신을 부추기느냐고 항의한 남성. 슈퍼마켓 매니저는 남성에게 사과한 뒤 며칠 뒤 다시 전화를 걸었습니다. 한 번 더 사과하기 위해서죠. 그런데 뜻밖의 대답이 돌아왔습니다. 반대로 사과를 받았거든요. 알고 보니 이 남성의 딸은 진짜로 임신한 상태였습니다. 부모도 모르는 사실을 슈퍼마켓이 알고 있었던 거죠.
어떻게 알았을까요? 이 슈퍼마켓은 빅데이터를 이용해 고객의 구매 행태를 분석하고 있었거든요. 이를 통해 고객 중 임신한 것으로 추정되는 여성을 가려 전단을 보냈던 것입니다. 빅데이터가 얼마나 유용한지를 보여주지만, 다소 섬뜩한 느낌을 주는 것도 사실입니다. 얼마든지 악용될 수 있다는 점을 강력히 암시하고 있기 때문이죠.
조태현[choth@ytn.co.kr]
[저작권자(c) YTN & YTN plus 무단전재 및 재배포 금지]
▶ 이 시각 코로나19 확진자 현황을 확인하세요.
▶ 대한민국 대표 뉴스 채널 YTN 생방송보기
▶ 네이버에서 YTN 뉴스 채널 구독하기
Copyright © YTN. 무단전재 및 재배포 금지.
- 도 넘은 배달 갑질..."음식 냄새나니 '화물용 승강기' 타라"
- '마약 가방' 택시에 두고 내린 남녀 붙잡혀
- "백신 접종자도 코로나 전파 가능...점막 보호 항체 생성 안 돼"
- 최재성 "USB 공개 안 돼...야당, 명운 걸어라"
- 세계 최고 부자 머스크 "8년 전 비트코인 샀어야"
- "돈 때문에 수학여행 못 가"…비용 대신 내준 학부모가 전한 '솔직 심정'
- 세계적 암 권위자 "조폭들 암 치료 효과 더 좋아...왜?"
- "피해자 탄원서도 소용 없다" 양형요소마저 뛰어넘는 김호중의 만행 [Y녹취록]
- 중학교 때 쓰던 가방 속 휴대폰 공기계 깜빡...결국 부정행위 처리
- "형사님 감사합니다"…동생 죽인 친형이 경찰에 고개 숙인 이유?