국립국어원, AI 언어자원 12종 공개…누적 134종

최희정 기자 2025. 9. 29. 14:28
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

국립국어원은 29일 신규 말뭉치 12종을 국립국어원 '모두의 말뭉치'에서 공개했다고 밝혔다.

국립국어원은 한국어 특화 인공지능(AI) 개발과 연구에 필요한 고품질 말뭉치 등 언어자원을 구축해 산업계 및 학계에서 활용할 수 있도록 공개하고 있다.

이번에 공개된 말뭉치는 다국어 언어 처리 및 인공지능 기반의 외국어 통·번역 모델 품질 향상에 필수적인 한국어-외국어 병렬 말뭉치 8종 등이다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

한국어-외국어 병렬 말뭉치, 수어 말뭉치 등 추가
'모두의 말뭉치' 첫 화면. (이미지=국립국어원 제공) *재판매 및 DB 금지


[서울=뉴시스] 최희정 기자 = 국립국어원은 29일 신규 말뭉치 12종을 국립국어원 '모두의 말뭉치'에서 공개했다고 밝혔다.

국립국어원은 한국어 특화 인공지능(AI) 개발과 연구에 필요한 고품질 말뭉치 등 언어자원을 구축해 산업계 및 학계에서 활용할 수 있도록 공개하고 있다. 국어원은 이번에 새로 공개한 12종을 포함해 지금까지 134종의 한국어 말뭉치를 공개했다.

이번에 공개된 말뭉치는 다국어 언어 처리 및 인공지능 기반의 외국어 통·번역 모델 품질 향상에 필수적인 한국어-외국어 병렬 말뭉치 8종 등이다. 이와 함께 한국수어 사용자의 소통 편의 증진을 위한 수어통역 기술 개발에 활용할 수 있는 한국수어 말뭉치 3종, 국어 역사 자료 말뭉치 1종이다.

이 말뭉치들은 인공지능 시대에 한국어를 매개로 하는 소통 확장 및 한국언어문화 전승에 기여할 수 있는 언어자원으로서 의의가 있다.

지금까지 공개된 134종의 말뭉치는 국어 연구와 언어 정보 처리 분야 연구 및 기술 개발에 활용하고자 하는 연구자, 개발자 등 누구나 이용할 수 있다.

'모두의 말뭉치' 누리집에서 온라인 약정서를 작성해 승인받으면 내려받을 수 있다.

국립국어원 관계자는 "한국어를 잘하고 한국문화를 잘 아는 독자 인공지능 개발을 뒷받침할 수 있도록 2030년까지 한국어·한국언어문화 말뭉치 누적 340종을 지속적으로 공개할 계획"이라고 말했다.

☞공감언론 뉴시스 dazzling@newsis.com

Copyright © 뉴시스. 무단전재 및 재배포 금지.