[기고] 데이터 과학자를 사랑할 수밖에 없는 이유
2012년 12월 하버드 비지니스 리뷰(Harvard Business Review)에서 ‘21세기에 가장 섹시한 직업’으로 선정된 '데이터 과학자(Data Scientist)'란 이 직업도 이제 햇수로 만 10살이 다 되어간다.
왠지 '데이터 과학자'라고 하면, 일반인이 보기에 "대기업에서 고액 연봉 받으며, 뭔가 특별한 사람만이 할 수 있는 멋진 직업"으로 느껴질 수 있지만, 현실에선 모든 데이터 과학자가 다 그런 것만은 아니다. 내가 원하는 직무가 아닌 열악한 환경 속에서 기업이 원하는 모든 전산 관련 업무를 하는 이들도 많다. 그럼에도 미국에서 2015년부터 5년 넘게 Job Posting 1위를 꾸준히 차지해왔던 인기 직업임엔 틀림없다.
데이터 과학자는 기본적으로 통계적 지식과 다양한 컴퓨터 능력 그리고 본인이 속한 분야에 전문적 지식이 요구되기에 고급 수준에 오르기까지 많은 본인의 노력과 시간이 필요하다. 게다가 빅데이터를 이용해 분석한 결과를 다른 사람에게 설명해야 하는 소통능력까지 요구된다. 어찌보면 만능 슈퍼맨이 되어야 한다.
그렇다면 데이터 선진국 미국에선 어떤 기업들이 데이터 과학자를 가장 많이 고용하고 있을까? 2019년 기준으로 데이터 과학자를 고용한 기업들의 수는 다음과 같다.
표에서 보는 바와 같이 전통 IT 기반의 IBM이 가장 많은 데이터 과학자를 고용하고, 다음으로 아마존, 마이크로소프트, 페이스북 순이다. 이미 우리에게 너무나 익숙한 기업들이다.
그렇다면 이와 별도로, 현재 전 세계에서 가장 큰 기업들은 어떤 순위일까? 2022년 5월 시가총액(market capitalization) 기준으로 1~5위 기업 중, 2위 Saudi Arabian Oil Company를 제외한 모든 기업이 모두 미국 기업이자 빅데이터 기반의 인공지능 회사들이다. 바로 애플, 마이크로소프트, 구글, 아마존이다.
공교롭게도 데이터 과학자를 많이 보유하고 있는 기업들이 전 세계 상위 그룹에 모두 포진되어 있다. 기존에 전통적인 기업으로 대표되던 Brick and mortar(소매, 오프라인 거래)는 많지 않음을 알 수 있다. 그리고 하나같이 한 분야에서가 아닌 다양한 분야에서 다양한 시도를 하고 있는 기업들이다.
구글의 예만 들어보아도 구글은 더이상 검색회사가 아니다. 주력인 검색 서비스를 넘어 스마트폰 운영체제인 안드로이드 사업, 클라우드, 소프트웨어 개발, 의료 데이터를 이용한 헬스케어, 양자 컴퓨터, 유통, 스마트시티, 유튜버를 비롯한 미디어 등 셀수없이 많은 분야에서 선두를 달리고 있다. 그 중심에는 최고 기술의 천재 데이터 과학자들이 있다. 이러한 다양한 분야에서의 전문성이 현재의 구글을 만들어 낸 것이다. 애플, 아마존, 마이크로소프트 역시 매우 비슷하다.
그렇다면 우리나라는 어떨까? 물론 삼성, 네이버, 카카오와 같은 빅데이터‧인공지능 기반의 회사들이 있지만, 이런 기업들을 제외한 대부분 기업에서는 데이터 과학자의 기준 자체도 모호할뿐더러 업무 전문성 확보도 안 된 상태라 연봉 역시 외국에 비해 적은 것도 사실이다. 다시 말해, 한국에서 데이터 과학자는 아직 사회적으로 제대로 인정받지 못하고 있다. 또한, 데이터 과학자들이 맘놓고 활용할 데이터가 많지 않기에 그만큼 경험 많은 베테랑 데이터 과학자가 배출되기 어려운 구조였다.
그러나 최근 상황은 변하고 있다. 정책적으로 데이터 3법(개인정보보호법, 정보통신망법, 신용정보법)에 이어 최근 데이터 산업법까지 제정되면서 우리나라에서도 데이터 활용에 대한 기회가 생겨나고 있다.
이 시점에서 데이터 과학자 양성에 집중해야 하는데, 이들이야말로 기존에 불가능해 보였던 일들을 가능하게 만드는 작업을 할 수 있기 때문이다.
그렇다면, 이들 데이터 과학자들이 어떤 분야에서 어떤 일을 할 수 있다는 것인가? 사실 거의 모든 분야에서 필요하겠지만, 특히, IoT(사물 인터넷), 5G, 클라우드, AI 분야에서 고급 데이터 과학자들이 많이 필요하다.
예를 들어보자. IoT는 말 그대로 사물들이 서로 인터넷처럼 연결되는 기능이므로 수많은 디바이스끼리 연결이 된다면, 우리는 실시간으로 엄청난 데이터를 분석할 수 있다. 당뇨병 환자의 경우, 간단히 칩 하나만 몸에 부착함으로써, 스마트폰을 가지고 매 순간 본인의 혈당을 측정할 수 있으며, 이에 맞는 식단을 매번 맞춤형으로 조절할 수 있게 된다. 뿐만 아니라, 기존에 혈당 측정을 위해 매번 살을 찌르는 고통을 피할 수 있고, 이러한 기록들이 병원으로 자동으로 전송되어 나의 다양한 기록들에 맞춰 운동, 식사량, 수면, 약 복용 등 맞춤형 생활 패턴을 제시할 수 있다.
이러한 디바이스들은 사람뿐 아니라 공장의 모든 공정에서도 적용되어 스마트팩토리 전환이 가능하며, 농장의 동식물에 수시로 연결되어, 그 자리에서 모든 결과를 스마트폰만으로 최적화 운용이 가능해질 수 있다. 말 그대로 진정한 의미에서 스마트팜이 가능해진다.
이러한 IoT 환경을 조성하기 위해선 고속, 대용량, 초저지연, 초고 신뢰성, 초다수 단말 접속을 가능하게 해줄 5G가 당연히 필요하게 되는데, 이 분야의 전문가 역시 필요해지게 된다. 또한, 이렇게 모인 데이터를 안전하게 보관해 어디서든 접근할 수 있는 클라우드 기반이 필요하다. 또한, 데이터를 사람의 감이나 주관적인 지식이 아닌 인공지능을 통한 의사결정이 가능하도록 하는 기술 역시 필요한데 이 모든 과정에서 데이터 과학자들의 능력이 요구된다.
인공지능 분야에 대한 예는 수없이 많지만, IT 분야와 거리가 멀어 보이는 패션분야에도 적용이 가능하다. 사실 폐기물을 가장 많이 생산하는 분야 중 하나가 패션 분야이다. 패션계는 매 시즌 새로운 옷을 개발하고, 수요를 예측하고 생산한다. 하지만 예측이 빗나가게 되면 매출의 감소는 물론 판매가 안 된 의류들은 더는 상품이 아닌 재고로 남게 된다. 이 의류들을 처리하기 위해 무차별 할인 같은 방법을 동원하지만 그럼에도 팔리지 않는 제품이 생겨난다. 이 때 대부분의 패션 브랜드는 소각 등의 방법을 통해 재고를 처리하는데 이 과정 역시 비용이 필요하다.
하지만, 만약 인공지능이 다음 시즌 의상의 판매량을 예측해 준다면, 기획단계부터 잘 팔릴 옷만 만들 수 있게 된다. 매출의 향상 뿐만 아니라, 재고의 부담도 줄이게 되어 이익 증대는 물론 친환경에도 앞장서는 기업이 될 수 있다. 이 얼마나 효율적인 방법인가? 그리고 실제 이러한 활용은 이미 현실에서 시험적으로 진행되고 있다.
이제 마무리하려 한다. 얼마 전, 손흥민 선수를 주장으로 한 대한민국 축구 대표팀이 카타르 월드컵 16강이라는 목표를 달성했다. 코로나, 우크라이나 전쟁, 그리고 금리 인상등으로 힘든 일상을 보내고 있는 전 국민에게 잠깐이나마 기쁨을 선사해주었다. 이번 월드컵에서도 많은 이변이 있었지만, 그중 하나는 크로아티아가 영원한 우승후보 브라질을 꺾으며 4강에 진출한 것이다. 그런데 여러분은 크로아티아 전 국민 수가 고작 400만 명이란 사실을 아는가? 서울 인구가 1,000만 명인데, 그 절반도 안되는 수치의 나라에서 이런 놀라운 결과를 만들어낸 것이다. 크로아티아가 축구를 잘하는 이유는 어린아이들이 축구를 할 만한 환경과 인프라가 매우 잘 갖춰져 있기 때문이라고 한다.
그런데 묘하게 각 나라 축구 대표팀과 데이터 과학자들은 닮은 점이 많다. 국가 면적이 크다고 해서, 인구가 많다고 해서 축구를 잘하는 것만은 아니다. 데이터 과학자들도 그렇다. 사실, 우리나라가 현재 선진국 반열에 설 수 있었던 이유도 바로 뛰어난 인재들을 키워낸 한 교육의 힘이다. 그렇기에 앞으로는 21세기의 원유라고 불리는 데이터 분야 인력양성에 투자해야 한다. 인재들이 이 분야에 뛰어들수록 그중에 천재성을 보이는 친구들이 있을 것이고, 이러한 친구들 중에 우리나라 빅데이터 인공지능 업계를 이끌어나갈 국가대표급 인재들이 나올 것이기 때문이다.
크로아티아의 축구처럼 데이터, 인공지능 분야에서 전 세계를 대표하는 한국의 데이터 과학자들이 나오지 말라는 법도 없다. 그리고 필자는 이런 날이 오기를 손꼽아 기다리고 있겠다.
○우종필 교수는…
우종필 교수는 미시간주립대학교(Michigan State University)에서 박사학위를 받았다. 현재 빅데이터학회 수석 부회장과 세종대학교 경영학과 교수, 빅데이터 MBA 주임교수직을 맡고 있다. 전 세계 3대 인명사전인 아르퀴즈 후즈 후(Marquis Who's Who)에 등재돼 있다. 지난 2019년 '제6회 코리아 빅데이터 어워드'에서 공로자부문 통계청장상을 수상했다. 저서로는 '빅데이터 분석대로 미래는 이루어진다', '구조방정식모델 오해와 편견' 등이 있다.
Copyright © 전자신문. 무단전재 및 재배포 금지.
- 삼성·LG "한 판 붙자" 대화면 게이밍 모니터 격돌
- 다누리 달 궤도 진입 최종 성공...우주탐사 시대 본격 개막
- 추경호 "새해 전기·가스요금 인상 폭 상당할 것…취약계층 부담 최소화"
- "스타트업 글로벌 진출 규제 뚫자"...'플립' 원인 분석
- [올해의 산업혁신기술상] 신기술로 '국가기술혁신'에 '탄소중립' 더하다
- 방통위 압수수색 상임위원실로 확대…TV조선 재승인 차질?
- '차세대 이차전지 도전재 준비 끝" 제이오, 1000톤 규모 탄소나노튜브 공장 완성
- [ET시론]러-우크라 전쟁과 반도체 패권
- [업무보고]과기정통부 "글로벌 과학강국·디지털 모범국가 실현"
- 전국 곳곳서 5G 28㎓ 서비스 사라져...KT 111대, LG유플러스 342대