과기정통부, 독자AI기반모델 성능평가 데이터셋 구축기관 모집
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
과학기술정보통신부는 한국지능정보사회진흥원(NIA)와 '독자 인공지능 기초 모형'(독자 AI 파운데이션 모델) 사업에 참여할 정예팀이 개발한 AI 모델의 성능을 평가하기 위해 '성능 평가 데이터셋 구축 사업' 수행기관을 17일부터 8월 7일까지 공개 모집한다고 밝혔다.
김경만 과기정통부 인공지능기반정책관은 "국민이 체감할 수 있는 고성능 국내 독자 AI 파운데이션 모델을 확보하기 위해서는 그 성능을 평가하는 데이터셋도 국내 사회·문화 환경 등이 반영돼야 한다"며 "이번 사업을 통해 구축한 성능 평가 데이터셋은 정예팀뿐 아니라 향후 국내 AI개발기관이 활용할 수 있도록 공개할 계획"이라 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

과학기술정보통신부는 한국지능정보사회진흥원(NIA)와 ‘독자 인공지능 기초 모형’(독자 AI 파운데이션 모델) 사업에 참여할 정예팀이 개발한 AI 모델의 성능을 평가하기 위해 ‘성능 평가 데이터셋 구축 사업’ 수행기관을 17일부터 8월 7일까지 공개 모집한다고 밝혔다.
이 사업은 독자 AI 파운데이션 모델 프로젝트의 일환으로, 국내 AI모델에 대한 성능평가에 활용할 데이터셋을 구축하는 게 목표다. 사업에 참여하려면 초거대AI나 자연어처리(NLP) 또는 멀티모달AI 등 대규모 데이터셋 기반의 AI개발 역량을 갖춘 기업·기관이 1개 이상 수행기관 컨소시엄에 포함돼야 한다.
그동안 AI모델 성능평가에 대부분 영어권의 평가지표가 활용돼 국내 서비스 이용환경 등을 충분히 고려하지 못했으므로 우리나라 문화와 사회적 가치 등을 반영하고 국내외 다양한 AI모델 성능을 객관적으로 진단한다는 취지다. 총 24억원(총 3개 과제, 과제별 8억원)을 투입해 고품질 성능 평가 데이터셋 구축을 추진한다.
올해에는 우선 △대형언어모델(LLM)의 수학 풀이 능력 평가 데이터(수학 분야) △한국형 지식을 평가하기 위한 주제별 질의-정답 및 추론 데이터(지식 분야) △장문 문맥에서 다양한 과업에 대한 성능평가 데이터(장문이해 분야) 등 3개 분야 데이터셋을 구축한다. 향후에는 멀티모달, 에이전트 등 생성형AI의 다양한 영역을 평가하기 위한 데이터셋을 구축해나갈 계획이다.
김경만 과기정통부 인공지능기반정책관은 “국민이 체감할 수 있는 고성능 국내 독자 AI 파운데이션 모델을 확보하기 위해서는 그 성능을 평가하는 데이터셋도 국내 사회·문화 환경 등이 반영돼야 한다”며 “이번 사업을 통해 구축한 성능 평가 데이터셋은 정예팀뿐 아니라 향후 국내 AI개발기관이 활용할 수 있도록 공개할 계획”이라 말했다.
팽동현 기자 dhp@dt.co.kr
Copyright © 디지털타임스. 무단전재 및 재배포 금지.
- 2인분 시킨 혼밥女에 “얼른 먹어라” 호통…풍자 극찬한 여수 유명맛집 무슨일
- 2살때 시력 잃고도 늘 웃음을 잃지 않던 20대, 3명 살리고 하늘로 떠났다
- 홈런하면 ‘갤Z폴드7’ 준다…삼성, 3개 구단과 프로야구 연계 마케팅
- 이선균 협박해 3억 뜯은 女실장, 2심서 형량 늘어…“반성하는지 의문”
- ‘3번째 음주운전’ 배우 박상민, 2심도 징역형 집행유예
- 바닷가 여행 후 중요 부위에 ‘뱀’ 같은 발진이…꿈틀대던 ‘이것’ 정체는
- 제주 고교생, 카페 여성화장실서 몰카…다수 동영상 발견
- 학원장이 제자 집 몰래 들어가 귀금속 ‘쓱’…황당 이유
- “예비군 꿀팁이라도”…캄보디아 ‘18~30세男’ 내년부터 군대간다
- “새 트로피 만들면 되지”…3억짜리 첼시 우승컵 트럼프 품에 안긴 전말