고품질 데이터 구축해 AI산업 경쟁력 강화한다

송인걸 선임기자 2026. 4. 1. 15:31
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

정부가 국내 인공지능(AI)산업 경쟁력을 강화하기 위한 데이터 구축 사업에 나섰다.

과학기술정보통신부(부총리 겸 장관 배경훈)는 한국지능정보사회진흥원과 공동으로 AI 모델 개발을 지원하는 AI 학습용 데이터를 구축하려고 1일 추론데이터 10종 구축 사업을 공모했다고 밝혔다.

이 사업은 논리적 사고 과정과 인과관계를 포함한 고품질 추론데이터를 구축해 AI 모델의 신뢰성과 산업 적용성을 높이고 국내 AI 산업 경쟁력을 강화하기 위한 것이라고 과기정통부는 설명했다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

과기정통부, 추론데이터 10종 구축사업 공모
언어모델·피지컬 AI 부문…데이터는 공개 방침
과학기술정보통신부는 국내 인공지능산업 경쟁력을 강화하기 위해 데이터 구축사업에 나섰다. 과학기술정보통신부 제공

정부가 국내 인공지능(AI)산업 경쟁력을 강화하기 위한 데이터 구축 사업에 나섰다.

과학기술정보통신부(부총리 겸 장관 배경훈)는 한국지능정보사회진흥원과 공동으로 AI 모델 개발을 지원하는 AI 학습용 데이터를 구축하려고 1일 추론데이터 10종 구축 사업을 공모했다고 밝혔다. 이 사업은 논리적 사고 과정과 인과관계를 포함한 고품질 추론데이터를 구축해 AI 모델의 신뢰성과 산업 적용성을 높이고 국내 AI 산업 경쟁력을 강화하기 위한 것이라고 과기정통부는 설명했다.

공모 부문은 대규모 언어모델(LLM)과 피지컬 인공지능 분야 10개 과제로 예산은 66억원이다. 대규모 언어모델은 여러 쪽에 나뉘어 실린 글과 표 등을 종합해 판단하고 결론을 내도록 학습하는 복합 문서 기반 전문 추론데이터, 한국어를 이해하는 과정에서 자주 발생하는 오류를 분석해 논리적인 수정 방안을 추론하는 오류 증강 및 교정 추론 데이터 등 다섯 가지다.

피지컬 인공지능은 물리적 특성을 포함한 합성 이미지에 전문가의 판정 기준을 더해 단순한 불량 판정은 물론 원인까지 밝히는 표면 결함 추론 데이터, 제조설비 멀티센서 이상 진단 및 원인 추론데이터, 로봇 작업 실패 원인 추론 및 복구 행동 데이터 부문 등 다섯 가지가 세부 과제다.

최동원 과기정통부 인공지능인프라정책관은 생성형 AI 확산으로 고차원적 추론과 맥락 이해가 가능한 학습용 데이터 수요가 증가하고 있다. 이번 사업을 통해 구축된 데이터는 AI Hub(aihub.or.kr를 통해 공개해 기업, 연구기관, 스타트 업 등이 자유롭게 활용할 수 있도록 제공할 방침이라고 밝혔다.

Copyright © 대전일보. 무단전재 및 재배포 금지.