보이스피싱 350건 30초 만에…국과수 ‘한국형 음성분석모델’ 선보여

수사 인력을 대상으로 국립과학수사연구원과 통합데이터분석센터가 새로 개발한 음성분석모델을 설명하는 박남인 연구사. 박다해 기자

“두 음성의 유사도가 낮아서 같은 사람인지 아닌지 판별이 어려운 음성 파일도 비교해서 들어볼 수 있을까요?”

지난 11일 강원도 원주의 국립과학수사연구원(국과수). 대검찰청·경찰청·국방부·경찰대 등에서 온 20명이 넘는 수사 인력이 한데 모였다. 국과수와 행정안전부 통합데이터분석센터가 공동개발한 ‘보이스피싱 음성분석모델’을 실제로 수사에 어떻게 접목할 수 있을지 처음 교육을 받는 자리였다. 박남인 국과수 디지털과 연구사가 해당 프로그램을 활용해 목소리 간 유사도를 판별하는 시연을 해보이자, 교육생들 사이에서 질문이 앞다퉈 나왔다.

한국형 음성분석모델 프로그램은 박남인 연구사가 2015년부터 업무 외 시간까지 투자해 만들어낸 최초의 프로그램이다. 지난해부터는 통합데이터분석센터와 협업했고 올해 개발을 완료했다. 그동안 국과수는 러시아와 영국에서 개발한 음성분석모델을 써왔는데 외국어로 학습된 모델 특성상 한국어를 사용하는 범죄자의 목소리 유사도를 판별하는 데 한계가 있었다. 인공지능 학습 기술을 활용해 탄생한 이번 모델은 그동안 사용해온 모델보다 판독률이 77%가량 높고, 분석 속도도 빨라졌다. 박 연구사는 “350개가량의 보이스피싱 파일을 분석하는 데 30초가 채 안 걸린다”고 설명했다.

세계 최초로 탑재된 기능도 있다. 바로 한 보이스피싱 범죄에 2명 이상이 가담했을 경우, 목소리를 따로 분리한 뒤 각 가담자가 참여한 다른 범죄의 음성 파일과 대조해 유사도를 분석하는 기능이다. 예컨대 한 보이스피싱 전화에 수사관 역을 맡은 ㄱ과 검사 역을 맡은 ㄴ이 동시에 있는 경우 이 기능을 활용하면 ㄱ과 ㄴ이 따로 가담한 다른 범죄는 무엇이 있는지, 이들이 소속돼 함께 움직이는 그룹에 누가 속해 있는지를 밝혀낼 수 있다. 같은 범죄그룹의 구성원들을 한데 묶고 관계도를 만드는 게 가능해진다.

전옥엽 국과수 디지털과 연구관은 “범죄를 저지를 때 ㄱ과 ㄴ 둘만 쌍을 이뤄서 하는 게 아니다. ㄱ과 ㄷ, ㄴ과 ㄹ 등 여러 인원이 역할을 나눠 보이스피싱 범죄에 가담한 경우 (이 모델을 이용하면) ㄱ·ㄴ·ㄷ·ㄹ 네명 모두의 상관관계를 확인할 수 있다”고 설명했다. 실제로 국과수는 이 방법을 활용해 범죄 연루자 5531명의 음성을 구분해 분석한 결과 총 235개 조직에서 633명이 활동하고 있다는 점을 밝혀낸 바 있다.

행정안전부는 오는 9월부터 전국 경찰이 이 분석모델을 수사 현장에서 쓸 수 있도록 도입하겠다고 밝혔다. 이날 교육을 들은 충남경찰청의 안정엽 경위는 “(음성을) 먼저 들어도 수사관 이야기만으론 강제성 있는 수사를 진행하기엔 부족하다”며 “이때 가장 먼저 하는 게 국과수에 음성 분석을 의뢰하는 거였는데, 이번 프로그램이 도입돼 수사관도 직접 유사도를 확인할 수 있다면 수사가 더욱 신속하게 진행될 것으로 보인다”고 말했다.

다만 보급형 모델이 ‘범죄자 그룹화’까지 가능한 버전이 아니라 음성 ‘일대일 유사도 분석’ 기능만 탑재하고 있다 보니, 실제로 보이스피싱범을 검거하기 위해선 더 많은 기능이 있어야 한다는 목소리도 있다. 한 교육생은 “피싱범들은 불특정 다수를 대상으로 여러 건의 통화를 하기 때문에 데이터베이스에 있는 다수의 음성 파일과 신규 음성 파일 중 일치되는 파일을 찾아낼 수 있는 ‘일대다’ 분석 기능이 필요하다”고 말했다.

박다해 기자 doall@hani.co.kr

한겨레

사회

보이스피싱 350건 30초 만에…국과수 ‘한국형 음성분석모델’ 선보여