멀티미디어 복원, 0과 1의 암호 속에서 사라진 정보를 찾다

김소연 기자 2024. 4. 27. 08:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

대검찰청. 게티이미지뱅크 제공

[편집자주] 과학동아는 1월호부터 대검찰청 과학수사부에서 진행하는 다양한 수사기술 연구를 가상사건을 통해 소개하고 있습니다. 

게티이미지뱅크 제공

○ 사건파일 #4 벌거벗은 임금님

"내가 창피해서 밖에 나갈 수가 없어…."

그럴 수밖에. 사실 이번 사건의 내용은 검찰로 사건이 송치되기 전부터 잘 알고 있었다. 임금님이 속옷 바람으로 도시 한복판을 걸어 다녔으니 말이다. SNS에 '#벌거벗은_임금님'을 검색하면 당시 임금님의 행차 장면을 촬영한 영상도 수백개 나온다. 임금님은 사건 발생 이후로 수사관인 나조차 만나길 꺼리고 있다.

임금님은 재단사 김재단 씨와 이재봉 씨에게 속아 안 보이는 옷에 수천만 원의 거금을 지불했다고 주장한다. 피의자의 말은 다르다. 자신들은 그런 거래를 한 적이 없으며 수사기관에서 내놓은 증거가 연로한 임금님의 기억뿐이라 충분치 않다는 주장이다. 시시비비를 가릴 추가 증거가 절실하다.

우리는 비밀을 만들기 어려운 세상에서 살고 있다. 라면 하나를 사러 편의점에 다녀오더라도 누군가에겐 반드시 목격되게 돼있다. 우선 집을 출발할 때, 편의점까지 걸어가는 길에서, 그리고 편의점에서 사람과 마주칠 수 있다. 당신이 닌자처럼 잽싸서 이동하는 내내 그 누구도 마주치지 않을 자신이 있다고 해도 마찬가지다. 2024년 대한민국에는 곳곳에 폐쇄회로(CC) TV가 깔려 있다. 그뿐인가, 요새는 대부분 차량에 블랙박스도 탑재돼 있다. 어디에든 증거가 남는다.

 

당신이 아주 유능한 닌자라서 라면을 사러 가는 경로에 있는 모든 CCTV와 블랙박스를 확인할 수 있다고 하자. 그래서 당신의 모습을 촬영한 모든 기록을 삭제했다고 하자. 그럼 비로소 비밀리에 라면을 사 오는 미션에 성공할 수 있을까. 이 질문에 '아니다'라고 답할 수 있는 이를 만나러 3월 4일 오후 대검찰청 과학수사부의 멀티미디어 복원실을 찾았다.

 

소병민 대검찰청 과학수사부 멀티미디어 복원실 분석관은 멀티미디어 복원실의 업무를 "'무의 상태'처럼 보이는 멀티미디어 데이터를 보거나 들을 수 있도록 만드는 것"이라고 설명했다. 멀티미디어란 영상, 음성, 문자 등의 복합 매체를 말한다. CCTV나 블랙박스로 촬영된 영상, 음성, 그리고 사진이나 문자까지 모두 멀티미디어의 영역에 속한다.

 

"멀티미디어 파일이 삭제되거나 손상돼 확인할 수 없는 경우 또는 파일을 확인할 수는 있지만 화질이나 음질을 개선하기 위한 프로그램을 구동할 수 없는 경우에 저희 멀티미디어 복원실로 옵니다."

 

● 전문가의 눈에만 보이는 복원의 열쇠

임금님의 진술에 따르면 피의자들은 알현실과 자신들의 차량에서 임금님과 접선해 '착한 사람 눈에만 보이는' 옷감에 대한 이야기를 나눴다. 알현실에는 CCTV가 피의자의 차량에는 블랙박스가 설치돼 있었다. 그러나 알현실의 CCTV는 촬영 후 시간이 너무 오래 지나 당시 촬영기록이 삭제된 상태다. 블랙박스의 경우 피의자가 임금님과 만났을 때의 기록을 삭제했다. 무슨 방법이 없을까. 지푸라기라도 잡는 심정으로 CCTV와 블랙박스 자료를 대검찰청 과학수사부 멀티미디어 복원실로 보냈다.

 

멀티미디어 복원은 크게 복구와 복원으로 나뉜다. 우선 멀티미디어 데이터 복구는 삭제된 데이터를 다시 되돌리는 작업이다. 저장매체의 파일을 지웠다고 해도 실제 파일의 데이터가 바로 없어지는 게 아니다. 도화지에 연필로 그림을 그리는 과정을 생각해 보자. 그림을 다 그리고 보니 도화지의 한 귀퉁이에 새로운 그림을 그리고 싶어졌다. 그럼 그 영역을 바로 지우지 않고 '지우고 새로 그림을 그려도 될 영역'으로 지정해 둔다. 실제로 그 영역을 지우고 새로 그림을 그리기 전까지는 해당 영역에 그림이 아직 남아있다.

 

마찬가지다. 데이터를 삭제한다는 건 전체 저장공간에서 해당 데이터가 저장된 공간을 '지우고 새로 데이터를 기록해도 되는 공간'으로 할당해 뒀다는 뜻이다. 그 위치에 새로 데이터를 저장하기 전까진 아직 이전 데이터가 남아있다. 멀티미디어 데이터 복구는 바로 이 상태의 삭제된 데이터를 다시 살리는 과정이다. 하지만 때가 늦어 새 데이터가 저장공간에 덧씌워진 경우엔 기존 데이터가 손실된다. 이때부턴 멀티미디어 데이터 복원의 영역으로 넘어간다. 조금이라도 남은 기존 데이터를 살려 유의미한 데이터를 얻어야 한다.

 

소 분석관은 이 과정을 "암호를 푸는 과정과 같다"고 말했다. 그러면서 실제로 삭제됐던 CCTV의 멀티미디어 데이터를 복원했던 사례를 소개했다. 해당 사건은 요양병원에 입원 중이던 할머니를 병원 관계자가 학대하고 방치한 사건이었다. 학대 사실을 입증하기 위해 요양병원 CCTV의 영상이 필요한 상황이었지만 이미 삭제된 뒤였다. 그런데 이 삭제된 파일이 요양병원 컴퓨터의 휴지통 폴더에서 발견됐다.

 

소 분석관은 컴퓨터 화면에 뜬 일련의 숫자열을 보여주며 설명했다. "파일을 열었더니 조각난 이미지들과 함께 이런 데이터가 보였어요. 무슨 뜻인지는 알 수 없었죠. CCTV를 만든 제조사만 아는 데이터입니다. 그런데 이 데이터를 살펴보니 규칙성이 있다는 걸 알게 됐어요."

 

기자의 눈에는 그저 무작위로 적힌 숫자로만 보였다. 의아해하는 기자에게 소 분석관은 '119, 210, 211, 212'라는 숫자 패턴을 예시로 들었다. 우리는 보통 119 다음에 120이 올 거라고 생각한다. 하지만 숙련된 멀티미디어 복원 전문가의 눈에는 19, 20, 21, 22를 나타내되 가운데에 숫자 1을 끼워 넣은 형태라는 게 보인다.

 

이런 데이터 속 규칙성은 멀티미디어 데이터를 복원하는 중요한 열쇠가 된다. 앞서 소개한 요양병원 학대 사건에서 이 데이터는 좌표의 역할을 했다. 데이터를 해독해 얻은 좌표에 따라 조각난 CCTV 이미지들을 이어 붙였더니 사건과 관련된 전체 이미지를 완성할 수 있었다.

● 소병민 분석관의 멀티미디어 복원 뒷이야기

대검찰청 멀티미디어 복원실에서 복원한 요양병원 CCTV 화면. 조각난 CCTV 이미지와 함께 저장된 숫자열을 분석해 해당 숫자열이 각 이미지 조각의 위치 좌표라는 사실을 밝혔다. 이를 통해 CCTV를 성공적으로 복원할 수 있었다. 대검찰청 멀티미디어 복원실 제공

인공지능(AI)이 그림도 그리고 글도 쓰고 과학 연구도 하는 세상이다. 멀티미디어 복원 작업도 AI로 할 순 없을까. 소병민 분석관은 "AI는 다량의 학습 데이터를 통해 작업방식을 익힌다"라며 "하지만 복원해야 할 손상된 멀티미디어 데이터는 한정적이라 아직은 AI를 적용하긴 어렵다"고 답했다

● 배움으로 남은 10여 년의 시간

대검찰청 멀티미디어 복원실의 소병민 분석관(왼쪽)과 윤현진 분석관(오른쪽)이 멀티미디어 복원실에서 포즈를 취하고 있다(좌측 사진). 복원의뢰를 받은 멀티미디어는 보안을 위해 밀봉돼 멀티미디어 복원실로 온다(우측 사진). 대검찰청 멀티미디어 복원실 제공

소 분석관은 대검찰청 과학수사부에서 이 싸움을 10여 년간 이어오고 있다. 그런 그에게 지난 기간의 소회를 물었다.

"검찰청에서 처음 이 일을 시작했을 때에는 멀티미디어 복원이란 분야가 다 미지의 영역이었습니다. 어디 물어볼 곳도 마땅치 않고 제가 분석하는 데이터들의 규칙성을 찾지 못하면 이대로 진실이 묻히는 건 아닌가 하는 불안한 마음에 집에 가기가 싫더라고요.

한참 수학 문제를 풀다가 답을 찾지 못하고 시간이 다 되어서 펜을 내려놓아야 할 때 그 찝찝함이랄까요. 그래도 요새는 그간 복원했던 경험이 전부 배움이 돼서 집에는 잘 가고 있습니다."

● 지우는 자와 살리는 자의 싸움 그 최전선에서

과학수사부 멀티미디어 복원실에 보냈던 CCTV 자료가 영상으로 복구돼 돌아왔다. 귀신같은 솜씨다. 그러나 CCTV로는 임금님과 두 피의자 사이에 어떤 대화가 오갔는지 알 수 없었다. 블랙박스 복원이 필요한 상황. 멀티미디어 복원실에서는 "복원의 실마리를 잡았으니 걱정 말고 잠시만 기다려라"라는 답이 돌아왔다.

통상적으로 음성 복원은 영상복원보다 더 까다롭다. 영상의 경우 한 프레임의 이미지만 복원해도 사건 발생 현장을 볼 수 있으니 의미가 있는데 음성의 경우 1초도 안 되는 한 프레임의 음성 데이터는 큰 의미가 없기 때문이다. '어' '가' 등 음절일 뿐이다. 영상에는 화면에 시간 정보가 기록되지만 음성엔 그런 정보가 없다는 단점도 있다.

"블랙박스에 녹음된 음성 파일을 복원한 적이 있어요. 가해자가 흉기로 피해자를 협박해 차량 내에서 성폭행한 사건이었는데 가해자가 블랙박스에 대화 내용이 녹음된 것을 알고 해당 부분을 삭제했었죠."

멀티미디어 복원실은 이 사건에서 블랙박스에 녹음된 차량 내부의 음성 데이터를 복구하기 위해 블랙박스의 영상 데이터를 활용했다. 영상과 음성 데이터가 함께 저장되니 영상 데이터의 시간 정보를 활용해 음성 데이터를 시간순으로 나열한 것이다.

소 분석관은 "이 밖에도 멀티미디어를 복원하는 방법은 많다"면서 "범죄자들이 새로운 방법으로 멀티미디어 데이터를 삭제할 때마다 우리는 거기에 맞춰 복원 방법을 고도화해 나간다"고 설명했다. 지우는 자와 살리는 자의 싸움이 끊임없이 이어지는 셈이다. 멀티미디어 복원실 분석관들의 끈기가 이 싸움에서 큰 무기로 활약하고 있다.

"임금님 이 옷 좀 보세요! 말씀드린 것처럼 아름답지 않습니까? 아니 반응이 왜 그러세요. 설마 옷이 눈에 안 보이는 건 아니죠? 아하하. 자 그럼 약속하신 금액을 입금해 주시죠."

빙고. 블랙박스에 녹음된 파일에는 두 피의자와 임금님이 나눈 대화가 똑똑히 기록돼 있었다. 이 증거는 법정에서 피의자의 범행을 증명하는 데 중요하게 쓰일 것이다. 감사의 인사를 하러 멀티미디어 복원실에 전화를 걸었다. 복원을 담당한 분석관은 웃으며 답했다.

"저도 복원이 안 되면 수학문제 덜 푼 느낌이라 마음이 불안해지는데 사건이 잘 해결돼서 다행이에요."

※관련기사

과학동아 4월호, [대검찰청 과학수사노트] 멀티미디어 복원, 0과 1의 암호 속에서 사라진 정보를 찾다

[김소연 기자 lecia@donga.com]

Copyright © 동아사이언스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?