“정부 AI사업 이 모양?”…20%는 ‘있으나마나’ 사업비 가로채기도
헬스케어 등 64종 활용도 저조
“과기부, 원인 분석 등 대안 내야”
26일 국회예산정책처에 따르면 AI 학습용 데이터 구축 사업을 통해 개방된 데이터 가운데 일부는 활용되지 않거나 활용도가 저조한 것으로 드러났다.
지난해까지 개방된 AI 학습용 데이터 종류는 총 384종이다. 이 가운데 활용 건수가 10건도 되지 않는 데이터는 40종으로 확인됐다. 단 한 건도 활용되지 않은 데이터를 합하면 64종에 이른다.
데이터 종류를 보면 64종 중 58종은 질병진단 이미지, 의료영상·검사결과 등 의료·헬스케어 분야 데이터로 나타났다.
예정처는 “해당 분야에 AI 학습용 데이터 수요가 적거나 데이터 구축 물량이 충분하지 않아 빅데이터로서의 활용 가치가 높지 않기 때문인 것으로도 해석할 수 있다”고 봤다.
활용 건수별로 보면 1000건 넘게 활용된 데이터는 18종으로 가장 적다. 500건 초과~1000건 이하는 36종, 100건 초과~500건 이하 137종, 10건 초과~100건 이하 129종 등이다.
이 사업의 핵심은 AI가 스스로 학습할 수 있는 데이터를 구축하고 이를 무료로 개방하는 것이다. 중소·벤처기업, 스타트업 등이 AI를 활용한 제품과 서비스를 개발할 수 있도록 지원하겠다는 취지다.
현재까지 구축이 완료된 데이터는 총 691종이다. 이 가운데 384종은 AI허브 홈페이지에서 누구나 무료로 활용할 수 있다.
데이터 분야는 ▲법률 ▲특허 ▲헬스케어 ▲관광 ▲사물이미지 ▲도로주행 ▲CCTV 영상 ▲음성 데이터 ▲낚시성 기사 탐지 ▲자율주행 등으로 다양하다.
예정처는 “데이터는 ‘구축-공개-활용’의 산업 전주기로 확산될 때 정책의 효과성을 높일 수 있다”며 “과학기술정보통신부는 데이터 구축 이후 활용되지 않거나 활용도가 낮은 데이터에 대해서는 원인을 면밀하게 분석하고 활용도를 높일 방안을 다각도로 모색할 필요가 있다”고 지적했다.
데이터 가공업체 대표 A씨는 2021년 5월부터 12월까지 구축 사업을 수행하면서 이같은 범행을 저지르다 특정경제범죄법상 사기 혐의로 재판에 넘겨져 징역 3년을 선고받았다.
국민권익위원회와 과기정통부는 추가 조사를 벌여 총 25개 기관이 수행한 9개 과제에서 부정집행 등 사업비로 인정할 수 없는 금액이 5억1477만원에 이른다고 밝혔다.
AI 학습용 데이터 구축 사업에는 최근 3년간 총 2564개 기관이 참여했다. 사업비는 1조2817억원이 투입됐다.
예정처는 “사업비가 투명하게 집행됐는지 면밀하게 점검하고 부정집행에 대한 모니터링과 이를 방지하기 위한 사후 관리도 중요할 것”이라며 “과기정통부가 부정집행 신고 사례 발생 이후에도 권익위 이첩 건에 대해서만 자체조사를 실시한 것은 적극적 후속 조치로 보기 어려운 만큼 조사대상을 확대하고 확실한 재발방지 대책을 마련할 필요가 있다”고 주문했다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- “교실 금쪽이들은 박사님 때문?”…오은영 SNS 난리난 이유 왜? - 매일경제
- “신원 미상男 KTX 선로 무단 진입 사망”…서울지하철 1호선·KTX 지연 - 매일경제
- 인터넷 최저가보다 더 싸다…“반값에 샀어요” 품절대란 몰고온 ‘공구’ - 매일경제
- 제주 줄고, 일본 늘자…전국 지자체 “여행비용 줄게” 손짓 [여행가중계] - 매일경제
- “20년 잊고 살았더니 대박”…묵히니 금 됐다, 11배나 오른 펀드는 - 매일경제
- “‘뛰지마라’는 엄마, 정작 이웃은 나를”…초등생의 호소문, 무슨일이 - 매일경제
- [단독] ‘국대’ 삼성의 새로운 무기 나온다…로봇시장 대격변 예고 - 매일경제
- ‘피겨여제’가 가장 가고 싶어한 이곳...한폭의 그림, 어디길래 - 매일경제
- 카페 절반이 채소밭인데도 사람 몰린다는 ‘이곳’ - 매일경제
- 제일렌 브라운, 보스턴과 3억 400만$ 계약 연장...NBA 최대 규모 - MK스포츠