국립국어원, AI 언어자원 12종 공개…누적 134종
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
국립국어원은 29일 신규 말뭉치 12종을 국립국어원 '모두의 말뭉치'에서 공개했다고 밝혔다.
국립국어원은 한국어 특화 인공지능(AI) 개발과 연구에 필요한 고품질 말뭉치 등 언어자원을 구축해 산업계 및 학계에서 활용할 수 있도록 공개하고 있다.
이번에 공개된 말뭉치는 다국어 언어 처리 및 인공지능 기반의 외국어 통·번역 모델 품질 향상에 필수적인 한국어-외국어 병렬 말뭉치 8종 등이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[서울=뉴시스] 최희정 기자 = 국립국어원은 29일 신규 말뭉치 12종을 국립국어원 '모두의 말뭉치'에서 공개했다고 밝혔다.
국립국어원은 한국어 특화 인공지능(AI) 개발과 연구에 필요한 고품질 말뭉치 등 언어자원을 구축해 산업계 및 학계에서 활용할 수 있도록 공개하고 있다. 국어원은 이번에 새로 공개한 12종을 포함해 지금까지 134종의 한국어 말뭉치를 공개했다.
이번에 공개된 말뭉치는 다국어 언어 처리 및 인공지능 기반의 외국어 통·번역 모델 품질 향상에 필수적인 한국어-외국어 병렬 말뭉치 8종 등이다. 이와 함께 한국수어 사용자의 소통 편의 증진을 위한 수어통역 기술 개발에 활용할 수 있는 한국수어 말뭉치 3종, 국어 역사 자료 말뭉치 1종이다.
이 말뭉치들은 인공지능 시대에 한국어를 매개로 하는 소통 확장 및 한국언어문화 전승에 기여할 수 있는 언어자원으로서 의의가 있다.
지금까지 공개된 134종의 말뭉치는 국어 연구와 언어 정보 처리 분야 연구 및 기술 개발에 활용하고자 하는 연구자, 개발자 등 누구나 이용할 수 있다.
'모두의 말뭉치' 누리집에서 온라인 약정서를 작성해 승인받으면 내려받을 수 있다.
국립국어원 관계자는 "한국어를 잘하고 한국문화를 잘 아는 독자 인공지능 개발을 뒷받침할 수 있도록 2030년까지 한국어·한국언어문화 말뭉치 누적 340종을 지속적으로 공개할 계획"이라고 말했다.
☞공감언론 뉴시스 dazzling@newsis.com
Copyright © 뉴시스. 무단전재 및 재배포 금지.
- 'BTS 컴백' 공연 마친 하이브, 14%대 급락…재료 소멸 인식 영향
- 10년만에 근황 차태현 둘째딸…훌쩍 커 아빠랑 닮았네
- 충주맨 후임 최지호 "김선태에 사기 당한 느낌"
- '두문불출' 박나래, 절친 신기루 모친상 찾았다
- 방탄소년단 진 "BTS 활동, 7년 하고 빠지자는 마음 컸다"
- 이휘재 4년만 복귀…사유리 "따뜻한 오빠" 윤형빈 "좋은 선배"
- '둘째 임신' 유혜주, '남편 불륜설'에 입 열었다
- "기내서 승객 숨졌는데 회항 않고 13시간 비행"…英 여객기 논란
- "상간녀 된 거 같아" 신봉선, 김대희 아내 만났다
- "홍상수 유모차 밀고 있더라…아들은 훌쩍 커"