미디어젠, 52억원 규모 NIA ‘분야별 한국어 멀티세션 데이터 구축 사업’ 선정
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
미디어젠 컨소시엄이 전문 지식 분야의 사용자 질문에 대해서도 인공지능(AI) 챗봇이 정확한 정보를 제공할 수 있도록 하는 '분야별 한국어 멀티세션 데이터 구축 사업'에 선정됐다고 5일 밝혔다.
이번 사업은 '과학기술정보통신부'가 주관하고 '한국지능정보사회진흥원(NIA)'이 추진하는 2023년도 인공지능 학습용 데이터 구축 사업의 하나로, 생성형 AI 챗봇을 통해 전문 지식을 바탕으로 상세한 답변을 제공할 수 있도록 한다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
미디어젠 컨소시엄이 전문 지식 분야의 사용자 질문에 대해서도 인공지능(AI) 챗봇이 정확한 정보를 제공할 수 있도록 하는 ‘분야별 한국어 멀티세션 데이터 구축 사업’에 선정됐다고 5일 밝혔다.
이번 사업은 ‘과학기술정보통신부’가 주관하고 ‘한국지능정보사회진흥원(NIA)’이 추진하는 2023년도 인공지능 학습용 데이터 구축 사업의 하나로, 생성형 AI 챗봇을 통해 전문 지식을 바탕으로 상세한 답변을 제공할 수 있도록 한다.
미디어젠 컨소시엄은 △비디 △메트릭스 △코리아퍼스텍 △한알음정보 △이즈테크놀로지 등 6개 전문 기업으로 구성됐으며, 주관·참여 기관 모두가 NIA의 인공지능 학습용 데이터 사업 진행 경험을 보유한 전문 기업들로 구성됐다. 이번 과제에서 각 컨소시엄 참여 기업은 AI 데이터 설계, 품질 관리, 전문 지식 문서 아카이브 구축, 데이터 정제 및 가공, 데이터 검수, 공정 관리, AI 모델 생성 및 평가 등 양질의 데이터 구축을 위한 역할을 분담한다.
이번 사업의 목적은 챗-GPT(Chat-GPT) 등과 같은 질의응답 대화 능력을 탑재한 ‘한국형 생성형 AI 챗봇’을 개발할 수 있도록 한국어 데이터를 구축하는 것으로, 특히 일반인들이 답변하기 어려운 전문 지식 분야의 데이터를 대량으로 구축하는 것이다.
이를 위해 기술과학, 사회과학, 일상대화의 전문 지식이 담긴 전문 문서 약 25만건을 자체 아카이브에 디지털화해 저장하며, 챗봇 대화의 다양한 주제에 대해 정확한 정보를 제공할 수 있게 된다. 또 오랜 시간이 지난 뒤에도 이전 대화를 기억해 대화를 이어갈 수 있는 챗봇 알고리즘을 통해 더 친밀한 대화가 이뤄질 수 있다.
이번 사업에서는 총 18만건 규모의 멀티세션 데이터를 구축할 예정이다. 어떤 주제를 갖고 대화를 시작할 때부터 대화가 끝날 때까지를 하나의 세션이라고 칭하며, 멀티세션은 이런 세션이 둘 이상으로 이뤄진 것을 뜻한다. 각 세션 사이에는 몇 시간에서 몇 주일까지 시간 차이가 생길 수 있기 때문에, AI 챗봇이 이전 대화 내용을 기억할 수 있도록 모델링하는 게 중요하다.
이번 사업을 총괄하고 있는 미디어젠 윤종성 AI 연구소 부소장은 “최근 생성형 AI 챗봇 기술에 대한 관심이 높아지고 있으며, 사업에서 구축되는 데이터도 한국형 AI 챗봇의 개발에 크게 기여할 것이라고 기대된다”며 “대화 데이터와 함께 질의응답에 사용된 다양한 주제의 전문 문서도 함께 제공되므로 여러 영역에서 지식을 주고받는 AI 챗봇의 확대를 기대할 수 있을 것”이라고 말했다.
분야별 한국어 멀티세션 데이터 구축은 올해 연말까지 진행되며, 구축이 완료된 뒤에는 NIA가 운영하는 AI-Hub를 통해 모든 데이터가 일반에 공개될 예정이다.
미디어젠 소개
미디어젠은 음성 인공지능(AI) 기반 기술을 바탕으로 스마트카, 스마트 컨택센터, AI 에듀테크, AI 키오스크, 다국어 AI 통역 서비스 등 다양한 사업 분야에서 더 앞선 신기술과 서비스를 제공하는 코스닥 상장 기업이다. 최근 초거대 AI를 위한 데이터 구축 및 생성형 AI 챗봇 기술 등 최신 알고리즘을 개발해 첨단 기술 사업화에 앞장서고 있다.
이 뉴스는 기업·기관·단체가 뉴스와이어를 통해 배포한 보도자료입니다.
출처:미디어젠
보도자료 통신사 뉴스와이어(www.newswire.co.kr) 배포
Copyright © 뉴스와이어. 무단전재 및 재배포 금지.
- 한국요꼬가와, 생물의약품 내 미세 입자 분석을 위한 Flow Imaging Microscopy 웨비나 개최 - 뉴스와이
- LG에너지솔루션 버테크, 대규모 ESS 프로젝트 공급 계약 체결 - 뉴스와이어
- 플라스틱프리, 흑백정육왕 챌린지로 친환경 캠페인 동참 - 뉴스와이어
- 한 해의 끝에서 정영환 작가와 푸른 숲이 전하는 위로와 휴식, 삼원갤러리 ‘TIMELESS BLUE’ 개최 -
- 도쿄관광한국사무소, 도쿄를 환하게 수놓는 겨울 이벤트의 대명사 ‘Roppongi Hills Christmas 2024’ 소
- 현대엘리베이터, 승강기 유지관리대수 20만 대 돌파 - 뉴스와이어
- 두산에너빌리티, 한전KPS와 ‘가스터빈 서비스 사업’ 협력한다 - 뉴스와이어
- 하자센터 ‘인스파이어✕하자 데이’ 성료 - 뉴스와이어
- 산업용 데이터 인프라 솔루션 컨포트랩, 2년 연속 CES 혁신상 수상 - 뉴스와이어
- 도시바, 낮은 온저항과 높은 신뢰성의 자동차 트랙션 인버터용 베어 다이 1200V SiC MOSFET 테스트 샘