한국 IT 발전소 '데이터댐' 어디까지 왔나
[편집자주]‘디지털 뉴딜’은 ‘그린 뉴딜’과 함께 현 정부 대표 정책인 ‘한국판 뉴딜’의 양대 축을 이뤄온 사업이다. 신종 코로나바이러스 감염증(코로나19) 대유행에 따른 경제위기를 극복하기 위한 D(데이터)·N(네트워크)·A(인공지능) 기반 대한민국 회복전략으로 정의된다. 지난해 7월 발표 이후 올해까지 약 10조1000억원의 예산이 ‘디지털 뉴딜’에 투입됐다. 한 해 동안 거둔 성과를 바탕으로 최근 정부는 ‘한국판 뉴딜 2.0’을 발표했다. ‘디지털 뉴딜’도 2.0버전으로 업그레이드되며 2025년까지 총 49조원 규모의 투자가 추진된다. 핵심사업인 ‘데이터댐’의 비중이 더욱 높아지고 ‘메타버스’가 새로운 키워드로 포함됐다. 이들을 중심으로 ‘디지털 뉴딜 1.0’의 흔적을 살펴보고 ‘디지털 뉴딜 2.0’이 나아갈 길을 짚어본다.
(1) 한국 IT 발전소 ‘데이터댐’ 어디까지 왔나
디지털 뉴딜 사업 중에도 첫손에 꼽히는 것은 ‘데이터댐’이다. ‘한국판 뉴딜’ 10대 대표과제에도 포함된 이 댐은 물 대신 데이터를 모아둔다. 현실의 댐이 가둔 물을 각종 용수나 전력생산에 쓰듯 빅데이터를 수집·가공해 인공지능(AI) 분야를 비롯해 다양하게 유통·활용함으로써 각종 산업 고도화와 부가가치 창출을 꾀한다. 맡은 역할로 과거 미국의 대공황을 이겨낸 원조 뉴딜의 후버댐에 비유되기도 한다.
━
산업 분야별 데이터 공급·활용을 위한 빅데이터 플랫폼의 경우 주무부처인 과학기술정보통신부가 2019년 금융·환경·문화·교통·헬스케어·유통·통신·중소기업·지역경제·산림 10개 분야 플랫폼(100개 센터)을 구축·운영 중이며 농식품·해양수산·소방안전·스마트치안·라이프로그·디지털산업혁신 6개 플랫폼도 지난해 추경으로 추가 구축됐다. 구축된 빅데이터 플랫폼을 통해 지난해까지 3000종, 올해 4000종 이상의 데이터가 축적·개방됐다.
특히 AI 학습용 데이터의 경우 과기정통부와 구축사업 주관기관인 한국지능정보사회진흥원(NIA)이 올해 6월 첫 ‘수문 개방’을 했다. 지난해 구축된 음성/자연어·헬스케어·자율주행·비전·국토환경·농축수산·안전·기타(패션 등) 8대 분야 170종의 AI 학습데이터 약 4억8000만건이 ‘AI허브’ 웹사이트를 통해 먼저 개방됐다.
━
빅데이터 플랫폼 4036종, AI 학습용 데이터 4억8000만건, 공공데이터 10만5000개 등 10억건 이상 데이터가 구축·개방·활용되면서 올해 국내 데이터 시장도 전년 대비 14.3% 성장했다. 데이터·AI 바우처는 12만7000개사에 지원됐고 이 중 12만개사(94.6%)가 비(非) ICT기업으로 조사됐다.
정부는 이런 성과를 바탕으로 ‘디지털 뉴딜 2.0’에서도 데이터댐을 중심으로 디지털 전환을 가속한다는 전략이다. 2025년까지 AI 학습용 데이터 1300종을 구축하고 분야별 빅데이터 플랫폼 31개를 마련하는 것을 목표로 삼았다. 구축된 데이터를 산업 여러 영역에서 활용할 수 있도록 가명정보 결합, 분야별 활용 경진대회 등을 통해 민간 활용을 촉진한다. AI의 경우 지역 거점 중심 선도사업도 추진한다.
━
AI 학습용 데이터 구축에 크라우드소싱으로 참여한 4만여명 중 61%가 취업준비생, 경력단절여성, 실업자 등 고용 취약계층이다. 이 크라우드워커들은 간단한 교육을 거쳐 주로 데이터 라벨링 작업에 참여한다. 강아지와 고양이가 함께 찍힌 사진이면 각각에 강아지, 고양이 어노테이션(주석)을 다는 식으로 AI가 구분해 학습할 수 있게 하는 작업이다. 그 특성상 ‘인형 눈알 붙이기’에도 곧잘 비유된다.
SW공학 전문기업 씽크포비엘의 박지환 대표는 “올해 일부 공공기관의 특정 데이터셋 이미지 5만여장을 진단한 결과 AI 학습 관점에선 불과 231장으로 보일 수밖에 없을 만큼 편중된 것으로 나타났다”며 “도쿄패럴림픽에서 도요타 자율주행차가 선수를 쳐 운행이 중단된 사고가 발생한 것도 AI 학습용 데이터 오류나 편향 가능성을 검증하지 않았기 때문”이라고 짚었다.
데이터 컨설팅 전문기업 비투엔의 조광원 대표는 “수많은 데이터가 구축되고 있는데 그 품질에 대한 검증이 부족한 상태로 데이터댐에 축적되면 활용단계에서 더 많은 수고와 비용이 발생하고 자칫 문제로 이어질 수 있다”며 “더러운 물이 유입되면 댐 전체 수질이 나빠지는 것과 같다. 지금까지 데이터의 양적인 측면에 집중했다면 이제 질적인 측면이 고려돼야 한다”고 지적했다.
크라우드워커들이 작업한 데이터의 질도 지적되지만 이 같은 일자리의 질도 문제로 거론된다. 결국은 ‘단기 알바’ 자리고 취업이 수월해질 만한 전문성이나 경쟁력을 키워준다고 보기도 어렵기 때문이다. 개발인력난을 겪는 SW업계 일부에선 이들이 데이터댐 구축 일선의 중소기업에 취업해 역량을 키울 수 있도록 정부 지원책 방향을 수정할 필요성도 제기한다.
이에 올해부터 주관기관인 한국데이터산업진흥원이 사업대가 산정 방식을 지원사업 형태로 변경하자 가공서비스 제공사 측에서 반발하고 나섰다. 용역사업 형태로 진행되던 기존과 달리 4대보험을 포함한 제반 경비 대부분이 인정되지 않는 데다 참여 인력의 실제 급여 내역도 제출하는 등 까다로워졌다. SW진흥법에 따른 적정 대가가 적용되지 않고 있다는 주장이다. 이밖에 사업 감리를 수행하는 외부 전문가 일부의 이해도 부족과 ‘갑질’에 대한 불만도 제기됐다.
━
날씨 데이터·서비스 전문기업 케이웨더의 윤현집 전략사업본부장(이사)은 “문제가 없는 것은 아니지만 데이터 산업을 키우고 데이터 기반 경제와 국가를 이루기 위해 꼭 필요한 정책”이라며 “기업이나 기관에서 부족하고 미숙한 점이 나오는 것은 세계 어느 나라도 가본 적 없는 길이기 때문일 수 있다. 가야 하는 길이니 설령 무리가 있더라도 가는 게 맞다”고 강조했다.
과기정통부 관계자는 “데이터 품질 관리에 대해서 고민이 많았던 것은 사실이다. 사전 검증 과정을 마련하는 등 개선을 꾀하고 있다”며 “크라우드워커의 경우 시급 등 여러 측면에서 장점이 있는 일자리로 마련했으나 한계점이 있는 것도 고려해 교육 제공 등으로 보완하는 노력을 지속하고 있다”고 말했다.
☞ 김소연, 물오른 미모 무슨일… 단발도 '찰떡'
☞ '최현석 딸' 최연수, 우월한 몸매 자랑… 허리가 '한 줌'
☞ '애프터스쿨 출신' 유이, 요요 고백 이후 근황… "역대급 바디프로필"
☞ 구혜선 근황, 밤샘 작업 직후 셀카… 흐트러짐 없는 美모
☞ 이경규 딸 이예림, 이 정도였어?… 결혼 앞두고 물오른 美모
☞ "걸그룹인줄…" 홍현희 어떻길래
☞ 이민영, 아침부터 '고기' 흡입하는 이유?
☞ 에일리, 한 달 만에 11㎏ 감량한 비법은 'ㅇㅇㅇ'
☞ 방탄소년단 '지민'이 키스한 폰 뭐지?
☞ "63세 맞아?" 美친 마돈나…망사 스타킹에 파격 패션
팽동현 기자 dhp@mt.co.kr
<저작권자 ⓒ '성공을 꿈꾸는 사람들의 경제 뉴스' 머니S, 무단전재 및 재배포 금지>
Copyright © 머니S & moneys.co.kr, 무단 전재 및 재배포 금지
- 김소연, 물오른 미모 무슨일… 단발도 '찰떡' - 머니S
- '최현석 딸' 최연수, 우월한 몸매 자랑… 허리가 '한 줌' - 머니S
- '애프터스쿨 출신' 유이, 요요 고백 이후 근황… "역대급 바디프로필" - 머니S
- 구혜선 근황, 밤샘 작업 직후 셀카… 흐트러짐 없는 美모 - 머니S
- 이경규 딸 이예림, 이 정도였어?… 결혼 앞두고 물오른 美모 - 머니S
- "걸그룹인줄…" 16kg 감량한 홍현희의 근황 - 머니S
- '편스토랑' 이민영, 아침 고기 1근 먹방 '거뜬'… 필라테스 자격증 보유까지 - 머니S
- 에일리, 한 달 만에 11㎏ 감량한 비법은… "하루 500칼로리만 섭취" - 머니S
- 방탄소년단 '지민'이 키스한 폰 뭐지? - 머니S
- "63세 맞아?" 美친 마돈나…망사 스타킹에 파격 패션 - 머니S