“정부 AI사업 이 모양?”…20%는 ‘있으나마나’ 사업비 가로채기도

김대영 매경닷컴 기자(kdy7118@mk.co.kr) 2023. 7. 26. 10:24
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AI 학습용 데이터 384종 개방
헬스케어 등 64종 활용도 저조
“과기부, 원인 분석 등 대안 내야”
[사진 출처 = 연합뉴스]
정부가 개방한 인공지능(AI) 학습용 데이터 10종 가운데 2종은 활용도가 떨어지는 것으로 나타났다. AI 학습용 데이터 구축 사업 참여기관 중에는 허위 직원을 등록해 약 14억원을 가로챈 곳도 있었다.

26일 국회예산정책처에 따르면 AI 학습용 데이터 구축 사업을 통해 개방된 데이터 가운데 일부는 활용되지 않거나 활용도가 저조한 것으로 드러났다.

지난해까지 개방된 AI 학습용 데이터 종류는 총 384종이다. 이 가운데 활용 건수가 10건도 되지 않는 데이터는 40종으로 확인됐다. 단 한 건도 활용되지 않은 데이터를 합하면 64종에 이른다.

데이터 종류를 보면 64종 중 58종은 질병진단 이미지, 의료영상·검사결과 등 의료·헬스케어 분야 데이터로 나타났다.

예정처는 “해당 분야에 AI 학습용 데이터 수요가 적거나 데이터 구축 물량이 충분하지 않아 빅데이터로서의 활용 가치가 높지 않기 때문인 것으로도 해석할 수 있다”고 봤다.

활용 건수별로 보면 1000건 넘게 활용된 데이터는 18종으로 가장 적다. 500건 초과~1000건 이하는 36종, 100건 초과~500건 이하 137종, 10건 초과~100건 이하 129종 등이다.

이 사업의 핵심은 AI가 스스로 학습할 수 있는 데이터를 구축하고 이를 무료로 개방하는 것이다. 중소·벤처기업, 스타트업 등이 AI를 활용한 제품과 서비스를 개발할 수 있도록 지원하겠다는 취지다.

현재까지 구축이 완료된 데이터는 총 691종이다. 이 가운데 384종은 AI허브 홈페이지에서 누구나 무료로 활용할 수 있다.

데이터 분야는 ▲법률 ▲특허 ▲헬스케어 ▲관광 ▲사물이미지 ▲도로주행 ▲CCTV 영상 ▲음성 데이터 ▲낚시성 기사 탐지 ▲자율주행 등으로 다양하다.

예정처는 “데이터는 ‘구축-공개-활용’의 산업 전주기로 확산될 때 정책의 효과성을 높일 수 있다”며 “과학기술정보통신부는 데이터 구축 이후 활용되지 않거나 활용도가 낮은 데이터에 대해서는 원인을 면밀하게 분석하고 활용도를 높일 방안을 다각도로 모색할 필요가 있다”고 지적했다.

인공지능 학습용 데이터 구축 사업비 불인정 금액 목록. [사진 출처 = 국회예산정책처]
구축 사업 참여기관 중에는 허위 직원을 등록해 정보통신진흥기금 13억7000만원을 가로채다 덜미가 잡힌 곳도 있다.

데이터 가공업체 대표 A씨는 2021년 5월부터 12월까지 구축 사업을 수행하면서 이같은 범행을 저지르다 특정경제범죄법상 사기 혐의로 재판에 넘겨져 징역 3년을 선고받았다.

국민권익위원회와 과기정통부는 추가 조사를 벌여 총 25개 기관이 수행한 9개 과제에서 부정집행 등 사업비로 인정할 수 없는 금액이 5억1477만원에 이른다고 밝혔다.

AI 학습용 데이터 구축 사업에는 최근 3년간 총 2564개 기관이 참여했다. 사업비는 1조2817억원이 투입됐다.

예정처는 “사업비가 투명하게 집행됐는지 면밀하게 점검하고 부정집행에 대한 모니터링과 이를 방지하기 위한 사후 관리도 중요할 것”이라며 “과기정통부가 부정집행 신고 사례 발생 이후에도 권익위 이첩 건에 대해서만 자체조사를 실시한 것은 적극적 후속 조치로 보기 어려운 만큼 조사대상을 확대하고 확실한 재발방지 대책을 마련할 필요가 있다”고 주문했다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?