소버린 AI, 진짜 韓문화 잘 아나…평가할 데이터셋 구축한다
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
과학기술정보통신부가 한국지능정보사회진흥원(NIA)과 '성능 평가 데이터넷 구축 사업' 수행기관을 오는 8월7일까지 공개 모집한다.
김경만 과기정통부 인공지능기반정책관은 "국민이 체감할 수 있는 고성능 국내 독자 AI 파운데이션 모델을 확보하기 위해선 그 성능을 평가하는 데이터셋도 국내 사회·문화 환경 등이 반영돼야 한다"며 "이번 사업을 통해 구축한 성능 평가 데이터셋은 정예팀 뿐만 아니라 향후 국내 AI 개발기관이 활용할 수 있도록 공개할 계획으로, 국내 AI 생태계 경쟁력 강화에 기여할 것으로 기대한다"고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

과학기술정보통신부가 한국지능정보사회진흥원(NIA)과 '성능 평가 데이터넷 구축 사업' 수행기관을 오는 8월7일까지 공개 모집한다. '독자 인공지능 기초 모형(독자 AI 파운데이션 모델)' 프로젝트 일환으로, 참여팀 AI 모델 성능 평가에 활용할 데이터셋을 구축하는 것이다.
그동안 글로벌 빅테크 기업을 필두로 다양한 생성형 AI 서비스가 등장했으나, 대부분의 성능평가에서 영어권의 평가지표가 활용돼 국내 서비스 이용 환경을 충분히 반영하지 못한다는 한계가 따랐다. 이에 우리나라의 문화, 사회적 가치 등을 반영하고 국내외 다양한 AI 모델의 성능을 객관적으로 진단하기 위해 총 24억원(총 3개 과제, 과제별 8억원)을 투입해 고품질 성능 평가 데이터셋을 구축한다.
이를 위해 AI 모델 개발 및 평가 분야의 국내외 산학 전문가 의견을 수렴·검토해 성능평가 데이터셋 구축 분야를 발굴했다. 올해는 △LLM(거대언어모델)의 수학 풀이 능력 평가 데이터(수학 분야) △한국형 지식을 평가하기 위한 주제별 질의-정답 및 추론 데이터(지식 분야) △장문 문맥에서 다양한 과업에 대한 성능평가 데이터(장문이해 분야) 등 3개 분야의 데이터셋을 구축한다. 향후에는 멀티모달, 에이전트 등 생성형 AI 모델의 다양한 영역을 평가하기 위한 데이터셋을 구축할 계획이다.
이번 사업 참여를 희망하는 기업·기관은 초거대 AI 또는 자연어처리, 멀티모달 AI 등 대규모 데이터셋 기반의 인공지능 개발 역량을 갖춘 기업·기관이 1개 이상을 컨소시엄에 포함해야 한다.
김경만 과기정통부 인공지능기반정책관은 "국민이 체감할 수 있는 고성능 국내 독자 AI 파운데이션 모델을 확보하기 위해선 그 성능을 평가하는 데이터셋도 국내 사회·문화 환경 등이 반영돼야 한다"며 "이번 사업을 통해 구축한 성능 평가 데이터셋은 정예팀 뿐만 아니라 향후 국내 AI 개발기관이 활용할 수 있도록 공개할 계획으로, 국내 AI 생태계 경쟁력 강화에 기여할 것으로 기대한다"고 말했다.
윤지혜 기자 yoonjie@mt.co.kr
Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.
- 신지, ♥문원 결혼 반대 여론에 울컥 "가장 무서운 댓글은…" - 머니투데이
- "죽을 생각만 했는데 박나래가 은인"…개그우먼 '눈물의 고백' - 머니투데이
- "신혼집에 15억 보탠 아버지, 예비 며느리에 주 1~2회 전화 요구"…누리꾼들 해법은 - 머니투데이
- 신지, 스토킹 피해 때 가까워진 ♥문원…"잤어?" 이상민 질문에 당황 - 머니투데이
- '생활고' 정가은, 서러움 폭발…"딸한테 몇천원 케이크도 못 사줘" - 머니투데이
- '삼전·현대차 줍줍' 대박 난 웰링턴..."지금 가장 싸다" 1조 베팅한 종목 - 머니투데이
- [단독]스타벅스도 '두바이 열풍' 참전…두바이 쫀득롤 출시 - 머니투데이
- "집은 간병한 막내에게" 아버지 유언 영상..."용돈 드렸다" 형제들 반발 - 머니투데이
- 한국 콕 집은 트럼프 으름장…"자동차 이어 우리도?" 반도체·가전 긴장 - 머니투데이
- 딸 혼자 산다고 광고하나?..."여중생 저녁 챙겨달라" 구인글 '시끌' - 머니투데이