엑스엘에이트 '실시간 번역 기법', 국제 컨퍼런스서 논문 승인

고석용 기자 2023. 11. 15. 19:30
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

승인받은 논문은 '단어 수준 번역을 통한 동시번역 향상(Enhanced Simultaneous Machine Translation with Word-level Policies)'으로 지금까지 기계 번역이 사용해온 단어를 서브단어(sub-word)로 쪼개 번역하는 대신 단어를 그대로 번역하는 방식을 제안해 높은 번역 성능을 보여준다는 점을 제안하고 있다.

엑스엘에이트에 따르면 실시간 기계번역을 수행하는 인공지능이 서브단어로 분할해 학습할 경우, 모든 서브단어가 처리되기 전에 부분적으로 처리된 상태에서 번역을 생성하는 경우가 많아 품질이 낮아질 가능성이 있다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

구어체에 특화된 인공지능 기계 번역 스타트업 엑스엘에이트(XL8)가 자연어처리(NLP)분야 국제 컨퍼런스인 'EMNLP'에서 실시간 번역 성능 향상을 위한 방법론으로 논문을 승인받았다. 해당 논문은 오는 12월 EMNLP 2023 파인딩즈에 개제될 예정이다.

승인받은 논문은 '단어 수준 번역을 통한 동시번역 향상(Enhanced Simultaneous Machine Translation with Word-level Policies)'으로 지금까지 기계 번역이 사용해온 단어를 서브단어(sub-word)로 쪼개 번역하는 대신 단어를 그대로 번역하는 방식을 제안해 높은 번역 성능을 보여준다는 점을 제안하고 있다. 엑스엘에이트의 김강, 조한규 리서치 사이언티스트가 공동 1저자로 참여했다.

엑스엘에이트에 따르면 실시간 기계번역을 수행하는 인공지능이 서브단어로 분할해 학습할 경우, 모든 서브단어가 처리되기 전에 부분적으로 처리된 상태에서 번역을 생성하는 경우가 많아 품질이 낮아질 가능성이 있다. 또 언어 모델과 실시간 기계번역 간 서브단어가 불일치하는 경우도 발생했다. 이번 연구는 단어 기반 번역을 통해 이런 한계를 극복해 더 낮은 지연시간과 높은 번역 성능 달성이 가능하다는 것을 입증했다.

이번 연구에서 제안된 실시간 번역 모델은 엑스엘에이트의 실시간 통번역 서비스 '이벤트캣(EventCAT)'에 통합돼 라이브 방송 및 스트리밍, 글로벌 컨퍼런스, 비즈니스 미팅, 라이브커머스 등 다양한 라이브 행사에서 다국어로 실시간 번역을 위해 사용되고 있다.

EMNLP에 채택된 엑스엘에이트의 논문

[머니투데이 스타트업 미디어 플랫폼 유니콘팩토리]

고석용 기자 gohsyng@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?