소름, 전화기 너머 그 목소리 분명 내 딸이었는데...[누구냐 넌 下]

송혜리 기자 2023. 4. 30. 09:30
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

기사내용 요약
목소리 복제 기술인 '딥보이스' 활용한 신종 보이스피싱 등장
3초 녹음본만 있으면 음성 복제가 가능할 정도로 기술 발전

[서울=뉴시스]


【서울=뉴시스】송혜리 기자 =
(엄마가 요리를 하면서 휴대전화로 통화를 하고 있다)

엄마 : 그래서 휴대폰을 떨어뜨려? 00아 넌 휴대폰을 사준 지가 언젠데 벌써 고장을 내. 80만원? 무슨 수리비가 그렇게 비싸?

(대문이 열리는 소리) 엄마 : 누구지? 너네 아빤가 보다.

(딸 00이 문을 열며 들어옴) 딸 : 다녀왔습니다~ 엄마, 오늘 저녁 뭐야?

엄마 : ...

휴대폰 속 목소리 : 엄마, 지금 돈 보내 달라니까? 듣고 있어?

공포영화가 아니다. 지난해 말 부산 사하경찰서가 공개한 보이스피싱 피해 예방 홍보영상이다. 엄마와 딸이 휴대폰으로 나눈 평범한 일상 대화가 사실은 보이스피싱이었다는 내용으로, 유튜브에 공개된 이후 현재까지 조회수 20만회를 기록하는 등 화제가 되고 있다.

8일 관련 업계에 따르면 이처럼 인공지능(AI)을 기반으로 한 음성 복제 기술 '딥보이스'가 보이스피싱 범죄에 악용된 실제 사례가 속속 등장하고 있어 주의가 필요하다.

편리함 위해 개발했지만…보이스피싱 악용에 제격

이미지 합성 기술인 딥페이크에 이어 등장한 딥보이스는 목소리 복제 기술이다. 특정인의 목소리를 딥 러닝으로 학습시켜, 해당 특정인이 실제 말을 하는 것처럼 만들어낸다.

소비자들은 이런 딥보이스 기술이 보이스피싱 발전에 기여할 것이라고 우려하고 있다. 아울러 콜센터나 행정기관의 전화응답 녹음본 해킹과 불법 음성 정보 판매도 성행할 것이란 지적이다.

아직 우리나라에서 딥보이스를 보이스피싱에 악용한 사례 발생은 미미하다는 것이 경찰청 설명이나, 해외에서는 2019년부터 꾸준히 보고되고 있다. 한 건에 수 백억원의 피해가 발생한 딥보이스 범죄도 있었다.

영국 더타임스에 따르면 캐나다 앨버타에 사는 벤저민 파커의 부모는 지난해 딥보이스를 이용한 보이스피싱 피해를 당했다.

파커의 부모는 자신을 아들의 변호사라고 소개한 사람의 전화를 받았다. 그는 파커가 교통사고로 미국인 외교관을 숨지게 한 뒤 수감돼 있다고 전했다. 이어 아들을 바꿔준다고 한 뒤 한 목소리를 들려줬다.

수화기 너머에서는 파커의 목소리와 매우 비슷한 음성이 흘러나왔다. "다음날 있을 법원 심리 전까지 2만1000캐나다달러(약 2000만원)을 송금해 달라"는 요청이었다.

빠른 속도로 발전하는 음성 복제 기술…보안 기술도 함께 고도화 해야

IT기업들은 음성 복제 기술 개발에 속도를 내고 있다. 이를 통해 사람의 업무효율을 증대 시키고, 더 편리한 생활 서비스를 구현할 수 있을 것으로 보기 때문이다.

올 초 마이크로소프트(MS)가 공개한 음성 합성 AI 모델인 '발리(VALL-E)'가 대표적이다. 발리는 3초 정도의 녹음본만 있으면 음성 복제가 가능하다. 화자의 감정, 톤이나 녹음 환경까지 재현한 복제 음성을 생성할 수 있다는 것이 타 AI와 다른 점이다. 다만, MS는 악용의 우려에 따라, 현재 해당 기술을 연구 시연 목적 샘플로만 공개하고 있다.

실생활에서도 음성 복제 기술을 어렵지 않게 찾아 볼 수 있다. 어린이 콘텐츠 서비스에서는 이를 '아빠·엄마가 읽어주는 동화 만들기'에 사용하고 있다. 부모가 샘플문장 300개 정도를 AI에 학습시키면, AI는 부모의 목소리로 동화를 읽어주거나 학습 도우미가 된다.

이런 서비스는 대개 '단기간에, 많지 않은 데이터로, 똑같은 목소리를 구현한다'는 것을 강점으로 내세우고 있다. 그러면서 얼마나 많은 사람들의 목소리를 비슷하게 내는 지가 관건이라고 설명한다. 역으로 생각하면 음성 복제를 갈수록 더 간편하게, 많이 할 수 있게 되는 셈이다.

전문가들은 관련 기술에 대한 국제적인 질서가 확립돼야 하는 시기라고 강조했다. 아울러 피해 예방을 위한 데이터 해킹 방지와 보안 기술 확보 노력도 발 맞춰 이뤄져야 한다고 설명했다.

임종인 고려대학교 석좌교수는 "가깝게는 틱톡 등에 숏폼을 올리는 그런 콘텐츠가 사실은 다 딥보이스, 딥페이크에 악용될 수 있는 것"이라고 말했다. 이어 "사람이 구분하기 힘든 수준으로 음성 복제 기술이 발전하고 있다"면서 "그러나 AI 기술은 앞다퉈 발전하고 있는데 우리만 뒤처지자고 할 수도 없을 것"이라고 말했다.

임 교수는 "관련 기술에 대한 국제 질서가 잡힐 때까지, 우리나라가 국제 규범과 아젠다 확립에 중추적인 역할을 해나갈 필요가 있다"면서 "아울러 자신의 게시글이 범죄에 노출될 수 있다는 것과, 이를 악용하지 않도록 하는 대국민 캠페인 등을 전개할 필요도 있다"고 말했다.

보이스피싱 대응 범정부 TF를 운영하고 있는 정부는 올해 과학기술·통신 발전에 따른 다양한 신종 범죄에 대응하기 위해 신규 추진과제를 적극 발굴해 나갈 예정이다.

경찰청 관계자는 "딥보이스를 악용한 보이스피싱 가능성은 이미 예측했던 부분이며, 관련 사례가 해외에서 보고됨에 따라 예의 주시하고 있다"며 "관련해 지난 2017년부터 서울대와 함께 개발한 목소리 성문분석 기술을 고도화하는 중"이라고 말했다.

한편, 보이스피싱은 첫 피해가 신고된 2006년 이후 16년 간 피해가 꾸준히 증가해 2021년도에만 총 피해금액이 7744억원에 이를 정도로 심각한 사회문제로 대두됐다. 정부의 단속과 수사, 통신·금융분야의 특별대책 등으로 지난해엔 발생건수·피해금액이 전년대비 30% 가량 감소했으나 여전히 범죄발생 2만1832건, 피해금액 5438억원에 달한다.

☞공감언론 뉴시스 chewoo@newsis.com

Copyright © 뉴시스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?