[백우진의 돈의 세계] 위노그라드 테스트
Time flies like an arrow(시간 파리는 화살을 좋아해). 1980년대 컴퓨터 번역의 수준을 가늠하는 데 참고할 사례다. 과거 ‘통계 기반 자동번역’ 방식은 상용화하기에는 품질이 너무 낮았다.
이어 등장한 번역 방식이 인공지능(AI)을 적용한 ‘신경망 기반 자동번역’이다. 과거에 비하면 향상됐지만 이 자동번역도 넘지 못한 벽이 있다. 그중 하나가 ‘위노그라드 스키마 챌린지’다. 간단히 말하면, ‘문장 속의 대명사를 정확하게 옮기는가’이다. 다음 문장의 ‘they’는 시의원들이다.
[원문] The city councilmen refused the demonstrators a permit because they feared violence.
이를 필자가 2017년에 AI 번역기에 작업시킨 결과는 다음과 같다.
[구글] 시의회 의원들은 폭력을 두려워 시위자들에게 허가를 거부했다.
[네이버 파파고] 시의원들은 시위자들이 폭력을 두려워했기 때문에 허가를 거부했다.
이 건에서는 구글이 조금 나았지만, 다른 문장은 네이버가 상대적으로 더 잘 옮겼다. 결론적으로 두 번역기 모두 위노그라드 테스트를 통과하지 못했다.
요즘 각광받는 ‘대규모 언어 모델(LLM)’ 기반 번역기들은 이를 쉽게 통과한다. 위 문장은 이렇게 옮긴다.
[딥L] 시의원들은 폭력을 우려해 시위대의 허가 신청을 거부했습니다.
그러나 LLM 번역기도 아직 취약한 대목이 있다. 수사법과 문맥 등이다. ‘In market we trust(우리는 시장을 믿는다).’를 ‘신뢰할 수 있는 시장에서.’라고 옮긴다. ‘Ma came to Tokyo to talk terms, and Son changed them.’은 ‘엄마는 도쿄에 와서 조건을 이야기했고, 아들은 조건을 변경했습니다.’라고 번역한다. 마윈과 손정의라는 문맥을 놓쳤다.
업무에 LLM 번역을 활용하는 기업이 늘고 있다. 번역기의 오류를 걸러내는 감수자의 역할이 더 중요해졌다.
백우진 경제칼럼니스트·글쟁이㈜ 대표
Copyright © 중앙일보. 무단전재 및 재배포 금지.
- "배우 김상경씨 감사합니다"…'폐암 4기' 경비원이 남긴 유언 | 중앙일보
- "뭐가 가장 힘듭니까" 묻자, 정몽구 딱 한마디 "노조다" | 중앙일보
- "챗GPT 안 쓰면, 학점 깎아요"…'표절' 걱정했던 대학이 바뀐다 [생성형 AI 임팩트] | 중앙일보
- 여기자 엉덩이 '툭' 성추행…생중계에 딱 걸린 스페인男 결국 | 중앙일보
- 백종원 "결국 건물주들만 좋은 일"…예산시장 상가 사버렸다 | 중앙일보
- "상속세는 엄마가 다 내세요"…불효 아닌 '똑똑한 절세'였다 | 중앙일보
- 합의문도 없는 희한한 북·러 정상회담…결국 비즈니스 관계였나 | 중앙일보
- 블핑 제니 SNS 게시물 하나가 28억 가치…"여기에 수출 길 있다" | 중앙일보
- "'역겹다'며 뱉기도…" 美이민자들 울린 한인소녀 '김밥 먹방' | 중앙일보
- "이재명 단식서 DJ 봤다"는 野…이유·시점·방식 전혀 달랐다 | 중앙일보