내년 AI 학습용 데이터 예산 31.8% 감소한 2805억..걱정 커져

김현아 2023. 10. 29. 10:35
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

윤영찬 의원 지적
정부, 2023년 AI 학습용 데이터 구축사업 예산
올해 4,114억원에서 31.8% 감소한 2,805억원으로 책정
“당초 구축하려던 데이터셋 목표에 적신호”
“AI 선도국가로 가는 길에 걸림돌”
[이데일리 김현아 기자]
윤영찬 의원(더불어민주당)

국회 과학기술정보방송통신위원회 윤영찬 국회의원(더불어민주당, 성남 중원구)이 과학기술정보통신부로부터 제출받은 자료를 분석한 바에 의하면, 늘어난 수요와 데이터 활용실적에도 불구하고 AI 데이터 구축 예산이 대폭 삭감된 것으로 나타났다.

지난 11일(수) 한국지능정보사회진흥원(NIA) 국정감사에 출석한 NIA 황종성 원장은 ‘현재 트렌드가 초거대AI라 기존에 하던 데이터셋 구축사업, 라벨링이 필요없다’고 발언했다.

그러나 이는 언어모델에 국한된 것으로, 다양한 분야에서 머신 러닝을 하는 기업이 많은 현 상황과는 맞지 않다는 게 윤 의원 지적이다.

또한 데이터셋 구축 사업은 중소·스타트업 등 데이터 자원이 필요한 기업 지원을 위해 마련된 것이므로 LLM(거대언어모델:Large Language Model)을 구축하는 초거대AI 대기업의 사례를 들며 해당 지원이 불필요하다고 주장하는 것은 무책임하다고 그는 비판했다. LLM을 하는 회사 또한 정교하게 정제된 데이터가 필요한 만큼 예산이 중요하기 때문이다.

내년 데이터 구축 예산 2805억..당초 대비 31.8% 감소

당초 과기부는 2020년부터 6년간 총 2조 5천억원을 투입해 1,300종의 데이터셋을 구축할 예정이었다. 그러나 2023년 AI 학습용 데이터 구축사업의 총 예산은 2,805억원(150종, 종별 단가 18.7억원)으로, 당초 계획이었던 4,114억 대비 31.8%가 감소했다.

윤 의원에 따르면 2024년 예산마저 대폭 삭감되어 558억원 수준으로 책정됐다고 밝혔다. 급격히 늘어나는 수요와 데이터 활용실적에도 불구하고, 사업규모가 과도하게 축소된 것이다.

그는 이 때문에, 2025년까지 1,300종의 데이터셋을 구축하기로 했던 애초의 사업 목표가 사실상 달성 불가능해졌다고 걱정했다.

민간기업의 데이터 경제 활성화를 위한 마중물 사업인 데이터 바우처사업, AI·클라우드 바우처사업 역시 대폭 축소됐다. 데이터, 인공지능, 클라우드 바우처의 수요기관이 증가함에 따라, 효과가 나오는 시점에서 최고 예산 규모였던 2022년 대비 25% 규모로 줄어든 것이다.

윤영찬 의원은 “ICT 분야는 기술 트렌드가 계속 변하는데, 트렌드만 쫓아가서는 지금의 초거대 AI 미래를 장담할 수 없다”며, “급변하는 추세에 맞춰 예산을 일부 조정할 수 있지만, 전 정권 지우기 차원에서 큰 규모의 예산을 삭감하는 것은 문제”라고 지적했다.

이어 “무분별한 예산 삭감은 윤석열정부가 표방하는 디지털 강국이라는 국정 운영 철학과도 맞지 않으며, 오히려 AI 선도국가로 가는 길에 걸림돌이 될 것”이라고 강조했다.

또한 데이터셋 구축 사업은 중소·스타트업 등 데이터 자원이 필요한 기업 지원을 위해 마련된 것이므로 LLM(거대언어모델:Large Language Model)을 구축하는 초거대AI 대기업의 사례를 들며 해당 지원이 불필요하다고 주장하는 것은 무책임하다. LLM을 하는 회사 또한 정교하게 정제된 데이터가 필요한 만큼 예산이 중요하기 때문이다.

당초 과기부는 2020년부터 6년간 총 2조 5000억원을 투입해 1,300종의 데이터셋을 구축할 예정이었다. 그러나 2023년 AI 학습용 데이터 구축사업의 총 예산은 2,805억원(150종, 종별 단가 18.7억원)으로, 당초 계획이었던 4,114억 대비 31.8%가 감소했다.

급기야 2024년 예산마저 대폭 삭감되어 558억원 수준으로 책정되었다. 급격히 늘어나는 수요와 데이터 활용실적에도 불구하고, 사업규모가 과도하게 축소된 것이다. 때문에, 2025년까지 1,300종의 데이터셋을 구축하기로 했던 애초의 사업 목표가 사실상 달성 불가능해졌다.

민간기업의 데이터 경제 활성화를 위한 마중물 사업인 데이터 바우처사업, AI·클라우드 바우처사업 역시 대폭 축소됐다. 데이터, 인공지능, 클라우드 바우처의 수요기관이 증가함에 따라, 효과가 나오는 시점에서 최고 예산 규모였던 2022년 대비 25% 규모로 줄어든 것이다.

윤영찬 의원은 “ICT 분야는 기술 트렌드가 계속 변하는데, 트렌드만 쫓아가서는 지금의 초거대 AI 미래를 장담할 수 없다”며, “급변하는 추세에 맞춰 예산을 일부 조정할 수 있지만, 전 정권 지우기 차원에서 큰 규모의 예산을 삭감하는 것은 문제”라고 지적했다.

이어 “무분별한 예산 삭감은 윤석열정부가 표방하는 디지털 강국이라는 국정 운영 철학과도 맞지 않으며, 오히려 AI 선도국가로 가는 길에 걸림돌이 될 것”이라고 강조했다.

(그래픽=문승용 기자)

김현아 (chaos@edaily.co.kr)

Copyright © 이데일리. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?