한동훈 처가 4명 연루 '허위 스펙 네트워크' 분석

최윤원 입력 2022. 6. 30. 20:00 수정 2022. 7. 1. 14:05
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.


한동훈 장관의 장녀 등 ‘산호세 허위 스펙 네트워크’ 14명

지난 5월 한동훈 법무부 장관의 인사청문 당시, 한 장관 장녀의 스펙 쌓기가 논란이 됐다. 한 장관 장녀가 쌓고 있는 스펙이 이미 미국 사립 대학에 입학한 조카들의 허위 스펙 쌓기에서 비롯된 입시 비리 의혹과 연계돼 있었기 때문이다.

뉴스타파는 한동훈 장관의 장녀와 조카들이 쓴 논문과 저술 활동, 봉사 단체 활동을 취재하던 중 한 장관의 또 다른 조카 진OO 군도 사촌 누나들과 함께 스펙 쌓기에 참여한 사실을 확인했다. 진OO 군은 미국 코네티컷 소재 사립학교에 재학 중이다.

한 장관 장녀의 스펙 쌓기 검증에서 시작된 뉴스타파의 취재는 한동훈 장관의 조카로 이어졌고, 한 장관의 장인 진형구 전 검사장의 손자와 손녀를 축으로 한 이른바 ‘산호세 허위 스펙 네트워크’로까지 확장됐다. 산호세 네트워크의 핵심은 진 전 검사장의 손녀·손자 4명이다.

▲ 진형구 전 검사장 가계도

진형구 전 검사장의 손자이자 진동균 전 부장검사의 아들인 진OO 군은 ‘팬데믹 타임스’(pandemic-times.news)라는 온라인 매체의 ‘편집장’으로 활동했다. 진 군은 또 환경단체 ‘퍼니클라이밋’(funnyclimate)에도 공동 창업자로 이름을 올렸다. 두 단체 모두 외사촌 누나들이 산호세 지역의 다른 고등학생들과 함께 설립한 단체이다.

▲ 팬데믹타임스 편집장(Editor-In-Cheif) 에 이름을 올린 진 군 ‘O O Chin’


▲ 봉사단체 ‘퍼니클라이밋’ 공동 설립자 중 한동훈 법무부장관 일가 3명

한국에서 학교에 다녔다면 고등학교 1학년인 진 군은 2020년 3월 설립된 온라인 매체 ‘팬데믹타임스’에 지난 5월까지 모두 38편의 기사를 올렸다. 이미 보도된 기사나 글을 정리 요약하는 수준의 글이었다.

진 군이 쓴 38편의 글 중 하나가 ‘The cactus may be hit by global warming hard’(지구 온난화로 선인장이 심한 타격을 받을 것이다)라는 제목의 글이다. 2021년 4월 17일 작성한 것으로 돼 있다.

그런데 이 글은 사흘 전인 4월 14일 자, 뉴욕타임스 기사를 그대로 베낀 것이다. 표절한 기사 제목은 ‘Even the Cactus May Not Be Safe From Climate Change’(기후 변화로 인해 선인장도 안전하지 않다)이다. 제목에서 ‘기후 변화’가 ‘지구 온난화’로 바꿨을 뿐 내용은 같다. 그러나 진 군은 뉴욕타임스 기사를 베껴 본인의 이름이 달린 ‘기명 기사’로 팬데믹타임스에 실었다.

더구나 뉴욕타임스 기사는 발생한 사건을 기술한 ‘스트레이트 기사'가 아니다. 기자의 고유한 시각이 담긴 일종의 ‘분석 기사'다. 하지만 진 군은 뉴욕타임스 기자의 해석과 주장을 단어 몇 개만 수정한 뒤 본인의 시각인냥 가져왔다. 베낀 기사의 하단에는 뉴욕타임스 기사의 웹주소를 달았다.

▲ 뉴욕타임스 (좌), 팬데믹타임스(우)

아래 제시한 뉴욕타임스 기사의 단어 수는 518개다. 그 밑에 제시한 진 군이 팬데믹타임스에 올린 기사의 단어 수는 519개다. 한 개의 단어만 차이가 나고 나머지 문장은 처음부터 끝까지 모두 똑같다. 딱 하나 추가된 단어가 ‘and’였다.

▲ 뉴욕타임스 (상), 팬데믹타임스(하)

진 군은 단어 몇 개를 살짝 바꾸는 이른바 ‘교활한 표절'(Sneaky Plagiarism)도 활용했다. 몇 가지 사례를 들면, ‘does not take’를 ‘didn’t take’로, ‘quarter of all’을 ‘¼ of the total’로 바꿨다.

뉴스타파는 해당 기사를 쓴 뉴욕 타임스 기자에게 연락해 표절에 대한 기자의 입장을 물었다. 뉴욕타임스 기자는 “명백히 본인의 기사를 표절한 것으로 보인다.” (This article seems pretty clearly plagiarized from my original NYT article’)고 밝혔다.

더 큰 문제는 이렇게 언론 기사를 베낀 진 군의 글이 온라인 학술지에도 게재됐다는 것이다. 진 군의 표절 기사가 논문으로 둔갑해 실린 곳은 ‘Journal of AI Applications’(JAA) 이라는 온라인 학술지다. 이 곳은 데이터에 기반한 애플리케이션 연구 학술지를 표방한다고 홍보하고 있다.

진 군이 베낀 기사는 수정이나 내용 추가는 따로 없이 학술지에 그대로 실렸다. 그러다 보니 일반적인 논문의 형식 요건, 즉 초록, 서론, 본론, 결론, 참고문헌 등은 제대로 갖추지 못했다.

뉴스타파가 진 군의 ‘표절 기사’가 ‘표절 논문’으로 바뀌어 JAA에 실린 경위가 무엇인지 취재를 시작하자마자 진 군의 글을 포함해 게재돼 있던 학생들의 논문이 모두 없어졌다. 얼마 뒤 JAA 홈페이지도 폐쇄됐다. 현재 홈페이지는 열리지 않고 있고, 진 군의 ‘표절 논문’도 찾아볼 수 없다.

▲ 폐쇄 전 온라인 학술지 JAA에 게재된 Chin 군의 논문 (오른쪽 아래 게시물)

뉴스타파는 진 군의 부모에게 이메일을 보내 진 군이 뉴욕타임스 기사를 베껴 팬데믹타임스에 기사를 올린 이유가 무엇인지, 또 베낀 기사를 또다시 온라인 학술지에  발표한 이유가 무엇인지 질의했다.

진 군의 부모 측 ‘저널 처음 알았고, 실린 사실도 처음 알았다’ 주장

그런데 전혀 예상하지 못한 답변이 왔다. 진 군의 부모 측은 JAA 저널을 처음 알았고, 진 군의 글이 저널에 실린 사실도 처음 알았다고 주장했다. 누군가 진 군의 글을 도용해 저널에 무단으로 실었다는 해명이었다.

진 군의 보호자 측은 국내 대형 로펌 소속 법률 대리인을 통해 “(JAA) 저널을 생전 처음 들어보았고, 팬데믹타임스에 올린 글을 논문화하여 출간한 바 전혀 없습니다. 만약 저널에 공식 출간된 증거가 있다면, 그것은 무단으로 진행된 것이므로, 그에 대한 조치도 검토할 예정”이라고 주장했다.

또 “팬데믹타임스는 학생들이 학습 과정의 일환으로 자발적으로 만들어 소통한 블로그형 홈페이지에 불과”하다고 해명했다. 그러나 뉴욕타임스 기사를 베낀 표절 행위가 어떤 ‘학습 과정의 일환’인지에 대해선 구체적인 설명을 내놓지 않았다.

‘산호세 허위 스펙 네트워크’ 논문 25건 전수 분석

진 군처럼 한동훈 법무부 장관의 장녀와 그녀의 외사촌들이 설립한 퍼니클라이밋, 펜데믹타임스 등 봉사단체와 온라인 매체 활동을 함께한 학생을 중심으로 스펙 네트워크를 찾기 시작했다.

스펙 쌓기의 핵심은 논문이었다. 학생들의 논문을 찾아 단독 또는 공동 저자의 명단을 작성했다. 논문의 공저자 등으로 얽혀 있는 14명을 확인했다. ‘산호세 스펙 네트워크’였다. 14명의 학생들이 쓴 논문은 모두 25개였다. 논문 작성은 2021년에 집중적으로 이뤄졌다.

▲ 산호세 스펙 네트워크 (논문, 온라인 매체, 봉사활동, 가족관계 등) 

뉴스타파는 14명이 작성한 논문 25건을 전수 조사했다. 특히 저자들 간의 관계, 학술지 발표 시기, 연구 주제 등을 분석했다.

14명의 논문 저자 네트워크의 중심은 한동훈 장관의 일가였다. 한 장관의 조카이며 미국 사립대학 펜실베이니아대(유펜) 입학이 예정된 최△△양은 가장 많은 10건의 논문을 썼다. 산호세 지역 고등학생들과 함께 공동 저자로 이름을 올린 논문이 7건이었고, 키르기스스탄, 짐바브웨, 중국 등의 외국의 연구자들과 함께 작성한 논문이 2건, 단독 논문이 1건이었다.

인천 송도 국제학교에 재학 중인 한동훈 장관 장녀는 가장 많은 단독 논문을 썼다. 모두 7건이다. 공동 논문은 2건이었다. 외사촌을 포함한 산호세 지역 고등학생 5명, 그리고 방글라데시 연구자와 공동으로 논문을 작성했다.

뉴스타파는 25건의 논문을 연구부정행위의 유형별로 조사해 분류했다. 약탈적 학술지에 발표된 논문은 20건이었다. 표절로 확인된 논문이 8건, 데이터 조작 논문도 5건 나왔다.

또한 언론의 보도가 시작된 이후 온라인 학술지에서 철회하거나 삭제한 논문이 지금까지 17건으로 확인됐다. 돈 들여서 만든 논문의 70%가량을 흔적도 없이 없애버렸다. 학생들이 삭제한 논문 중에는 언론에 보도된 적이 없는 것도 있었다.

▲ 산호세 허위스펙 네트워크 25개 논문 목록과 논문별 부정행위 유형

전체 논문 80%인 20건 약탈적 학술지 게재

약탈적 학술지(predatory journals)에 발표된 논문은 25건 중 20건이었다. 약탈적 학술지는 돈만 내면 별다른 심사 없이 논문을 게재해 주는 학술지를 뜻한다. 연구 성과가 없는 불량 논문을 양산해 학문 생태계를 망가뜨리는 악성 존재다.

모두 12개의 약탈적 학술지에 학생들의 논문이 실렸다. 방글라데시 등에 본사를 두고 있었다. 일부 학술지의 경우 사망한 사람과 가공의 유령 인물을 편집 책임자로  올렸다가 들통나기도 했다.

▲ 약탈적 학술지 목록 (12개)

표절 수법은 ‘교활한 표절’ 로 드러나

학생들의 표절 수법은 이른바 ‘교활한 표절’ 방식이었다. 모두 8건이 확인됐다. 문장의 구조와 단어 몇 개를 바꾸는 수법이다. 특히 산호세 지역 고등학생 저자만으로 구성된 공동 저자 논문 8건 중 5건이 ‘교활한 표절' 논문으로 확인됐다.

▲ 교활한 표절 논문 단어 교체·수정 사례

위의 표에서 제시한 것처럼, 학생들은 원논문의 단어를 유사한 동의어로 바꾸거나 표현을 조금 달리했다. behavior(행동)를 actions(행위)으로, scandal(스캔들)을 controversy(논쟁)로, violence(폭력)를 aggression(공격성)으로 바꾸는 식이다. 6∼7개의 단어가 연속적으로 동일해야만 표절로 인정하는 컴퓨터 프로그램의 적발을 피하려는 '꼼수'로 보인다.

실험 논문 5건 데이터 조작 정황 발견

학생들이 데이터를 분석한 ‘실험 연구’ 논문은 25건 중 5건이었다. 5건의 논문 전체에서 데이터 조작 정황이 발견됐다.

데이터 분석의 가장 기초적인 통계치가 잘못돼 있었다. 데이터 전체의 퍼센티지나 평균값이 전혀 맞지 않거나, 분석에 사용된 샘플 데이터의 숫자가 다른데도 평균과 표준 편차 등 통계 결괏값은 표절한 원논문과 소수점까지 똑같은 어이없는 결과가 나왔다.

하나의 사례를 들어보자, 학생들은 2021년 캘리포니아 지역의 자폐 아동을 대상으로 조사한 의학 논문을 발표했다. 학생들의 논문에 표가 나온다. 전체 자폐 아동 124명을 조사했는데 이 중 집에서 아이패드 사용이 가능한 자폐 아동은 58명으로 파악됐다며 그 퍼센티지를 50.75%라고 적었다.

50.75%라고? 잘못된 계산이다. 58명은 124명의 50.75%이 아니라 46.77%이기 때문이다. 어떻게 이런 엉터리 통계가 나왔을까.

치명적 오류의 비밀은 간단하다. 학생들은 2018년 12월 영국 에든버러 대학과 벨기에, 스페인 공동 연구팀이 발표한 논문을 표절했다. 원논문에도 표가 나온다.  전체 자폐 아동 134명을 조사했고, 이 중 아이패드 사용이 가능한 자폐 아동은 68명이었으며 그 비율은 “134명 중 68명에 해당하는 50.75%”라고 정확하게 계산해 썼다.

그런데 학생들은 원논문의 데이터를 베끼면서 어찌된 일인지 전체 샘플 134명을 그대로 쓰지 않았다. 임의로 10명을 줄여 124명이라고 표시했다. 전체 샘플 134명 데이터를 도용했다는 사실을 숨기기 위한 ‘꼼수’였을 가능성이 높다.

이 ‘꼼수’가 학생들의 발목을 잡았다. 학생들은 자신들이 전체 샘플 갯수를 10명 줄였다는 사실을 까맣게 잊었다. 이후 학생들은 전체 자폐 아동의 숫자(원논문 134명, 표절논문 124명)와 아이패드 사용이 가능한 자폐  아동의 숫자(원논문 68명, 표절논문 58명)가 서로 다르다는 사실을 전혀 고려하지 않은 채, 원논문에 나오는 결괏값(50.75%)만 기계적으로 베껴왔다.

▲ 데이터 조작 표절 논문(좌)과 원본 논문(우)

이렇게 말도 안 되는 ‘조작된 통계’가 나온 것은 전체 샘플의 숫자(134명 → 124명)를 바꾸면서도 정작 원논문 샘플의 퍼센티지(50.75%)는 그대로 베낀 필연적인 결과에서 비롯된다. 실제론 존재하지 않는 데이터를 있다고 속이는 데이터 조작의 구체적인 증거가 된다.

표절이라고 하면 사람들이 흔히 생각하는 문장들을 비슷하게 따오고 이런 것들을 많이 생각하시는데 물론 그것도 굉장히 문제지만. 이 경우는 연구하지 않았어요. 사실상 이건 연구를 당연히 하지 않았던 것이고. 저도 페이스북에 만약에 연구를 실제로 수행을 한 것이면 원문 데이터를 공개해라 (요구했는데), 저는 당연히 (공개)하지 못할 거라고 생각하고, 실제로도 (공개)하지 않고 있고요. 그래서 연구를 수행하지 않았는데 한 것처럼 사실은 다 베끼고 이렇게 했다는 것 자체가 사실 더 문제죠.
- 이상원 미국 뉴멕시코주립대 커뮤니케이션학과 교수 (논문 표절 피해자)

17개 논문 철회 또는 삭제

한동훈 법무부 장관의 인사청문회 이후 지금까지 학생들이 쓴 논문 25건 중 17건이 철회 또는 삭제된 것으로 확인됐다. 철회는 학술지 홈페이지에 논문 제목은 놔둔 채, 내용만 볼 수 없도록 조치한 것이고, 삭제는 홈페이지에서 논문의 흔적을 완전히 지우는 형태다.

처음엔 논문이 철회(Retracted)됐다고 기재했다가 나중에 아예 흔적도 없이 삭제되는 쪽으로 이어졌다. 아무 공지 없이 온라인 논문 목록에서 사라져 검색되지 않는 예도 많았다. 언론에 한 번도 언급되지 않은 논문이 삭제되기도 했다.

그러나 논문을 철회 또는 삭제하는 이유를 밝힌 곳은 거의 없다. 학술지에서 논문을 철회할 때는 그 사유를 공개적으로 밝히는 게 학계의 원칙이다.

제가 생각하기에는 자본주의 사회에서 어떤 식의 입시 시스템도 결국은 부모 재력이나 이런 거에서 완전히 동떨어질 수는 없다고 생각하는데요. 그거를 어느 정도는 인정한다고 치더라도. 출발선이 약간 다르다고 하더라도 결과적으로 그 과정에 있어서는 최대한 공정하게 유지돼야 하는데 이런 경우는 사실 편법을 넘어서서 완전히 표절 조작 이렇게 한 거기 때문에 이거는 편법이라는 말도 쓸 수가 없는 거죠. 이건 꼼수가 아니라 그냥 어떻게 보면 완전 잘못을 한 거니까 이런 것들은 그래서 문제가 될 것 같아요.
- 이상원 미국 뉴멕시코주립대 커뮤니케이션학과 교수 (논문 표절 피해자)

‘배보다 배꼽’ 게재 비용보다 삭제 비용이 더 비싸

학생들은 논문을 게재할 때도 돈을 냈지만, 삭제할 때도 돈을 지불했다. 학생들의 논문이 실린 학술지들이 요구하는 논문 게재 비용은 한 편당 50달러 정도였다. 그런데 논문 철회 또는 삭제 비용은 게재 비용보다 훨씬 비쌌다.

논문의 철회 비용은 1건 당 최소 150달러에서 최대 300달러, 삭제 비용은 이 보다 비싼 최소 300달러에서 최대 480달러를 요구했다. 뉴스타파는 학생 부모들에게 이메일을 보내 돈을 들여가며 논문을 없애는 이유가 무엇인지 물었지만, 답변은 없었다.

학생들이 쓴 25건 논문의 주제는 코로나19 시기 자폐 아동, 치아 위생, 건강관리 시스템, 인공지능, 기후 위기, 혐오범죄, 촛불집회 등 매우 다양했다. 분야별로는 의학을 주제로 한 논문이 9건으로 가장 많았다. 사회과학 8건, 컴퓨터 공학 4건 순이었다.

논문의 발간 시기는 2019년 6월부터 2022년 4월까지였다. 2019년 1건, 2020년 2건, 2021년 17건, 2022년 5건이었다. 이 시기는 나이가 각기 다른 학생들이 대입 준비를 위한 시기 즉 고등학교 1학년에서 2학년 사이와 기간이 맞물려 있었다.

▲ 학생들의 논문 작성 시기

뉴스타파 박중석 pjseok@newstapa.org

뉴스타파 최윤원 soulabe@newstapa.org

뉴스타파 이명주 silk@newstapa.org

Copyright © 뉴스타파. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?