엑스엘에이트 '실시간 번역 기법', 국제 컨퍼런스서 논문 승인
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
승인받은 논문은 '단어 수준 번역을 통한 동시번역 향상(Enhanced Simultaneous Machine Translation with Word-level Policies)'으로 지금까지 기계 번역이 사용해온 단어를 서브단어(sub-word)로 쪼개 번역하는 대신 단어를 그대로 번역하는 방식을 제안해 높은 번역 성능을 보여준다는 점을 제안하고 있다.
엑스엘에이트에 따르면 실시간 기계번역을 수행하는 인공지능이 서브단어로 분할해 학습할 경우, 모든 서브단어가 처리되기 전에 부분적으로 처리된 상태에서 번역을 생성하는 경우가 많아 품질이 낮아질 가능성이 있다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]
구어체에 특화된 인공지능 기계 번역 스타트업 엑스엘에이트(XL8)가 자연어처리(NLP)분야 국제 컨퍼런스인 'EMNLP'에서 실시간 번역 성능 향상을 위한 방법론으로 논문을 승인받았다. 해당 논문은 오는 12월 EMNLP 2023 파인딩즈에 개제될 예정이다.
승인받은 논문은 '단어 수준 번역을 통한 동시번역 향상(Enhanced Simultaneous Machine Translation with Word-level Policies)'으로 지금까지 기계 번역이 사용해온 단어를 서브단어(sub-word)로 쪼개 번역하는 대신 단어를 그대로 번역하는 방식을 제안해 높은 번역 성능을 보여준다는 점을 제안하고 있다. 엑스엘에이트의 김강, 조한규 리서치 사이언티스트가 공동 1저자로 참여했다.
엑스엘에이트에 따르면 실시간 기계번역을 수행하는 인공지능이 서브단어로 분할해 학습할 경우, 모든 서브단어가 처리되기 전에 부분적으로 처리된 상태에서 번역을 생성하는 경우가 많아 품질이 낮아질 가능성이 있다. 또 언어 모델과 실시간 기계번역 간 서브단어가 불일치하는 경우도 발생했다. 이번 연구는 단어 기반 번역을 통해 이런 한계를 극복해 더 낮은 지연시간과 높은 번역 성능 달성이 가능하다는 것을 입증했다.
이번 연구에서 제안된 실시간 번역 모델은 엑스엘에이트의 실시간 통번역 서비스 '이벤트캣(EventCAT)'에 통합돼 라이브 방송 및 스트리밍, 글로벌 컨퍼런스, 비즈니스 미팅, 라이브커머스 등 다양한 라이브 행사에서 다국어로 실시간 번역을 위해 사용되고 있다.
[머니투데이 스타트업 미디어 플랫폼 유니콘팩토리]
고석용 기자 gohsyng@mt.co.kr
Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지
- 류준열, 1년 전 이미 결별?…'♥혜리' 언급에 슬며시 자리 이탈 - 머니투데이
- GD, 자폐아母 댓글에 '좋아요'→화제되자 '취소'…내용 뭐길래 - 머니투데이
- "건보료만 월440만원" 염경환, 연봉 80억?…소문 퍼지자 한 말 - 머니투데이
- "윌 스미스 동성애자, 내가 현장 목격"... 비서가 폭로 - 머니투데이
- '성인 BJ' 7급 공무원 영상 발칵…"나 아닌데? 난 500개에 안 벗어" - 머니투데이
- 임신한 손담비 "잘 때 숨 안 쉬어져" SOS…무슨 일? - 머니투데이
- 청산가치 밑돈 삼성전자에서 벌어질 일…해야할 일 - 머니투데이
- '미성년자 성폭행' 고영욱, 이상민 저격…"인간으로 도리 안해" 무슨 일 - 머니투데이
- "거의 죽을 뻔" 문자를 "자살 시도"로…없는 것만 못한 애플AI - 머니투데이
- 트럼프 경호하는 로봇은 시작에 불과...로봇기술 선도하는 현대차그룹 - 머니투데이