디지스트 인공지능 학습용 데이터 구축 지원사업 선정
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
대구경북과학기술원(DGIST·디지스트)은 '2023년 인공지능 학습용 데이터 구축 지원 사업'에 선정됐다고 5일 밝혔다.
한국어 성능이 개선된 초거대 AI 언어모델 개발과 데이터 구축을 목표로 과학기술정보통신부, 한국지능정보사회진흥원(이하 NIA)로부터 14억원을 지원받아 과제를 수행한다.
연구팀은 이를 해결하기 위해 양질의 학습용 한국어 말뭉치 데이터를 구축하고 모델을 개발해 초거대 AI 언어 모델의 한국어 성능을 개선할 계획이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
대구경북과학기술원(DGIST·디지스트)은 ‘2023년 인공지능 학습용 데이터 구축 지원 사업’에 선정됐다고 5일 밝혔다.
한국어 성능이 개선된 초거대 AI 언어모델 개발과 데이터 구축을 목표로 과학기술정보통신부, 한국지능정보사회진흥원(이하 NIA)로부터 14억원을 지원받아 과제를 수행한다.
이번 과제에는 과제 책임자인 디지스트 전기전자컴퓨터공학과 김대훈 교수를 중심으로 송진영 교수 연구팀, 인하대학교 김도국 교수 연구팀, 빅웨이브에이아이, 디지스트 학생창업기업 유니바가 컨소시엄을 구성해 참여한다. 연구팀은 지난 7월부터 연구·개발에 착수했다.
Chat-GPT, Google의 Bard와 같은 AI 언어 모델 기반 대화 서비스가 등장하면서 누구나 쉽게 초거대 언어 모델 기반의 서비스를 이용하고 있다. 하지만 이러한 초거대 언어 모델 기반의 서비스는 한국어에 대한 이해가 부족해 사용 시 불편을 겪을 수 있다. 연구팀은 이를 해결하기 위해 양질의 학습용 한국어 말뭉치 데이터를 구축하고 모델을 개발해 초거대 AI 언어 모델의 한국어 성능을 개선할 계획이다.
과제 책임자 김대훈 교수는 “언어 모델을 학습하기 위한 한국어 데이터가 매우 부족한 상황”이라며 “디지스트, 인하대 연구팀, 관련 기업이 함께 머리를 맞대면 초거대 언어 모델 기반 서비스들의 한국어 성능 개선에 크게 기여할 수 있을 것”이라고 말했다.
한편 인공지능 학습용 데이터 구축 지원 사업은 인공지능 학습용 데이터·모델 구축·개방을 통해 인공지능 생태계 조성과 일상화를 목표로 과학기술정보통신부가 주관하고 NIA가 추진하는 사업이다. 2805억원의 예산을 투입해 150종의 신규 데이터를 구축한다.
대구=최일영 기자 mc102@kmib.co.kr
GoodNews paper ⓒ 국민일보(www.kmib.co.kr), 무단전재 및 수집, 재배포금지
Copyright © 국민일보. 무단전재 및 재배포 금지.
- ‘왜 거기’…주차장 엎드린 6살 밟고 지나간 차 [영상]
- 접촉 사고에 ‘괜찮다’는 롤스로이스 차주, 가수 김민종
- 옷 훌렁, 손 힘 풀려 폰 털썩…식당 주인 살해후 포착
- “32개월 아기, 식당 테이블에 손가락 긁혀…배상되나요”
- 폐지 노인 비 막아준 ‘우산 천사’…‘현금 3만원’도 뽑아 줬다
- ‘안 가요, 안 가’… 중국 간 여행객, 코로나 이전의 30%
- “일개 초선 의원이 볼썽사납게”… 민주, 윤미향에 ‘불편’
- 대통령실, ‘홍범도 흉상’ 비판 文에…“지나치게 나서는 게 문제”
- “뭐가 아쉬워서”…최원종, 10억대 아파트에 혼자 살았다
- 출퇴근에 보온병도 논란인 이재명…與 “웰빙단식 그만”