"절대 바이든으로 안 들려, 자막이 엉터리" 음성 전문가 주장

나성원 2022. 9. 30. 18:50
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

윤석열 대통령의 발언 논란이 지속되는 가운데 국내 음성인식연구 전문가가 "소리를 직접 여러 번 들었는데 절대 '바이든'으로 들리지 않는다"고 주장했다.

이어 "대통령의 발언을 자동음성인식기에 넣어보았는데 어떤 음성인식기에서도 '바이든'이라는 단어를 찾을 수 없었다"며 "한국어 음성인식 성능이 가장 좋은 인식기에서 나오는 답은 '신인 안해주고 만들면 쪽팔려서'였다"고 했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

성원용 서울대 교수 "어떤 음성인식기에도 '바이든' 안 나와"
"'바이든'이라고 들린다는 사람 많은 건 자막 때문"
윤석열 대통령과 조 바이든 미국 대통령이 지난 21일(현지시간) 미국 뉴욕 한 빌딩에서 열린 글로벌펀드 제7차 재정공약회의를 마친 뒤 대화를 나누고 있다. 연합뉴스


윤석열 대통령의 발언 논란이 지속되는 가운데 국내 음성인식연구 전문가가 “소리를 직접 여러 번 들었는데 절대 ‘바이든’으로 들리지 않는다”고 주장했다.

성원용 서울대 전기정보공학부 명예교수는 지난 29일 자신의 페이스북에 “윤 대통령의 뉴욕 발언은 매우 잡음이 많고 불분명한데 여기에 MBC가 자의적으로 자막을 달아 송출했다”며 이 같이 주장했다.

성 교수는 국내 음성인식 분야 전문가로 꼽힌다. 성 교수가 포함된 연구진은 지난 2018년 ‘구글 AI(인공지능) 집중연구 어워즈’에서 음성인식 관련 연구로 수상을 한 바 있다.

성 교수는 이번 논란과 관련해 “음성인식 과정에서 잡음이 많은 음성의 경우 사전정보에 더 의지한다”며 “언론은 이런 사전정보가 유도하는 편견을 막도록 노력해야 한다”고 했다.

성 교수는 “‘바이든’이라고 들린다는 사람이 많은데 이미 (방송) 자막을 봤기 때문”이라며 “당연히 대부분의 사람들은 ‘소리’를 따라 듣지 않고 ‘자막’을 따라 듣는다”고 했다.

이어 “대통령의 발언을 자동음성인식기에 넣어보았는데 어떤 음성인식기에서도 ‘바이든’이라는 단어를 찾을 수 없었다”며 “한국어 음성인식 성능이 가장 좋은 인식기에서 나오는 답은 ‘신인 안해주고 만들면 쪽팔려서’였다”고 했다.

성 교수는 “이 문제의 핵심은 데이터 변조”라며 “언론인이나 연구자의 주장과 입장은 존중돼야 하지만 데이터 변조는 사소한 것도 용인돼서는 안 된다”고 주장했다.

성 교수는 또 “자막을 엉터리로 붙인 것은 고의성이 있는 데이터 조작”이라며 “국민들의 60%가 바이든으로 들린다 하는데 이미 자막을 봤기 때문이다. 자막 조작의 위험성을 보여주는 데이터”라고 주장했다.

윤 대통령의 발언을 놓고 논란이 계속되는 상황에서 여야는 30일 공방을 벌였다.

이재명 더불어민주당 대표는 이날 윤 대통령을 향해 “지금 들어도 바이든 맞지 않으냐. 욕 했지 않느냐. 적절하지 않은 말 했잖느냐”며 “국민도 귀가 있고, 판단할 지성을 가지고 있다. 거짓말하고 겁박한다고 해서 생각이 바뀌거나 들었던 사실이 없어지지 않는다”고 직격했다.

신주호 국민의힘 부대변인은 “민주당의 확증편향과 내로남불이 이어지고 있다”며 “분명 왜곡된 보도의 자막에 의해 사실이 아니라고 수없이 말했다. 민주당은 대한민국 국익을 위한 정당인가, 아니면 민주당만의 이익을 위한 이익집단인가”라고 반박했다.

나성원 기자 naa@kmib.co.kr

GoodNews paper ⓒ 국민일보(www.kmib.co.kr), 무단전재 및 수집, 재배포금지

Copyright © 국민일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?