과기정통부, 묵혀둔 AI 데이터 생성형 AI용으로 되살린다
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
과학기술정보통신부가 기존 판별형 인공지능(AI) 중심 라벨링 데이터를 추론·행동 정보를 포함하는 생성형 AI용 데이터로 전환하는 업사이클링 사업에 나선다.
과기정통부와 한국지능정보사회진흥원은 AI 허브에서 제공 중인 기존 학습용 데이터를 최신 생성형 AI 환경에 맞게 재가공하는 'AI 학습용데이터 업사이클링' 사업 공고를 지난달 30일 시작했다고 7일 밝혔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
(지디넷코리아=이나연 기자)과학기술정보통신부가 기존 판별형 인공지능(AI) 중심 라벨링 데이터를 추론·행동 정보를 포함하는 생성형 AI용 데이터로 전환하는 업사이클링 사업에 나선다.
과기정통부와 한국지능정보사회진흥원은 AI 허브에서 제공 중인 기존 학습용 데이터를 최신 생성형 AI 환경에 맞게 재가공하는 'AI 학습용데이터 업사이클링' 사업 공고를 지난달 30일 시작했다고 7일 밝혔다.
이번 사업은 대규모언어모델(LLM)과 피지컬 AI 분야를 중심으로 총 30종 데이터셋을 재가공하는 데 30억원이 투입된다. 신규 구축 대비 예산 효율이 높다는 점도 장점으로 꼽힌다. 사업 대상은 AI 허브에 구축된 데이터 691종을 생성형 AI용 확장 가능성·활용도 기준으로 전수 분석하고 외부 전문가 검토를 거쳐 최종 30종을 선정했다.

LLM 데이터 분야에선 기존 텍스트 데이터를 질문-근거 검토-오류 검증-답변 확정으로 이어지는 추론 과정을 포함하도록 재구성한다. 동일 문제에 대해 복수의 추론 경로를 구성하고 근거 기반 판단 및 오류 수정 과정을 포함해 복잡한 문제 해결이 가능한 추론형 AI 학습 기반을 마련한다.
피지컬 AI 분야에서는 기존 이미지·영상 데이터를 시각 정보(V)·언어 명령(L)·행동 및 제어(A)를 통합한 구조로 고도화한다. 객체 인식을 넘어 시간 흐름에 따른 상황 변화와 객체 간 상호작용을 이해하고 목표 기반 행동을 생성할 수 있도록 연속적 장면 정보와 객체 움직임 데이터를 활용해 행동 경로와 작업 목표를 정의하는 형태로 재구성한다.
업사이클링된 데이터는 AI 허브 홈페이지를 통해 공개돼 기업·연구기관·스타트업 등이 자유롭게 활용할 수 있도록 제공될 예정이다.
최동원 과기정통부 인공지능인프라정책관은 "이번 업사이클링 사업으로 적은 비용으로도 최신 생성형 AI 기술 환경에 맞는 학습용 데이터를 확보할 수 있을 것"이라며 "이미 축적된 데이터 자산이 낭비되지 않도록 활용 가치를 끌어올리겠다"고 밝혔다.
이나연 기자(ny@zdnet.co.kr)
Copyright © 지디넷코리아. 무단전재 및 재배포 금지.
- 정부, AI 학습용데이터 첫 전수조사…'AI허브' 경쟁력 높인다
- 정부, AI 추론데이터 10종 구축 나서…"사고·판단 능력 강화"
- 과기정통부, 'AI 민생 10대 프로젝트' 시동…8개 과제 수행사 공모
- "수십억원 손실도"…삼성전자 노조 파업, 소부장 업계 '비상등'
- 쿠팡 개인정보 유출 조사 마무리…개인정보위 "곧 결정"
- 정부 GPU 프로젝트, 네이버·삼성·엘리스 3파전 윤곽…목표 물량 확보는 '난제'
- "정용진 회장 혁신 통했다"...이마트, 1Q 영업익 14년 만에 최대
- 트레이더스 키운 이마트·허리띠 졸라맨 롯데마트...투톱 체제 강화
- 박병무 엔씨 대표 "2030년 5조 매출 순항…지속 성장 확신"
- SK이노, 중동 전쟁이 등 떠민 '정유·석화' 호실적…시장 예의주시