표절, 그리고 환각 인용 [한승훈 칼럼]

표절의 피해자들이 자기 이름이 지워진 채 글을 빼앗겼다면, 환각 인용의 피해자들은 자기가 쓰지도 않은 글을 인용당하고 있는 셈이다. 나아가 실제 저자가 존재하지 않는 글이 주석에 실리는 경우는 ‘피해자’가 누구인지조차 불분명하다. 기술의 도움을 받아 가짜 참고 문헌들로 손쉽게 양산된 논문들이 폭증한다면, 학계의 검증 시스템에 심각한 부하가 걸릴 것은 분명하다.

한승훈 | 한국학중앙연구원 교수(종교학)

학술지에 투고된 논문을 심사하는 일은 연구자의 일상 업무 가운데 하나다. 학술논문이 적절한 형식에 따라 작성되었는지, 실험 데이터, 통계 조사, 문헌 자료 등이 변개나 조작 없이 정당하게 이용되었는지, 해당 학술지의 방향성에 맞는 주제인지 등을 그 분야의 동료 평가를 통해 판단하는 것이다. 평가의 엄밀성과 공정성을 위해 일반적으로 심사자는 2~3명의 전문가로 구성되며, 심사자와 피심사자는 모두 익명으로 처리된다. 심사자의 기본적인 책임은 논문의 통과 여부를 결정하는 것이지만, 원고의 수정과 보완을 권고해 글을 개선하도록 하는 일도 중요한 역할이다. 학문의 목적이 인류 지식의 확충과 공유라면, 저자와 심사자는 이 공동의 목적을 위해 협력하는 관계인 셈이다.

그렇기 때문에 나는 논문의 학술지 게재 여부를 평가하는 일은 되도록 관대한 기준으로 이루어져야 한다고 생각하는 편이다. 물론 세상에는 대단히 훌륭한 논문만 있는 것은 아니다. 상대적으로 사소한 문제에 천착하거나, 연구 과정에 오류가 있거나, 대부분의 사람이 동의할 수 없는 주장을 하는 논문도 있을 수 있다. 그러나 그런 글도 최소한의 요건을 갖추었다면 일단 발표하게 두고, 공개적인 비판에 노출하는 편이 학문 발전에는 도움이 된다. 그럼에도 불구하고 탈락시킬 수밖에 없는 논문은 있다. 약간의 농담을 섞어 말하자면, ‘세상에 나와서는 안 되는 논문’들이다.

대표적인 것이 표절 논문이다. 나는 표절이라는 말이 한국 사회에서 너무 가볍게 사용되고 있는 것이 불만이다. 이 단어가 전문적인 학문적 훈련을 받지 않은 채 경력 관리를 위해 손쉽게 학위를 딴 공직 후보자나 유명인들을 공격하는 수단으로 남용된 나머지, 학계 밖에 있는 사람들은 표절을 인용 형식 위반 정도의 경미한 실수로 오인하는 경향이 있기 때문이다. 이 말은 기존 저작물과의 표면적인 유사성 같은 것과는 직접적인 관련이 없다. 그 한자어 표현(剽竊)이나 영어 개념(plagiarism)은 모두 ‘훔치다’라는 의미를 담고 있다.

따라서 표절이라는 말은 피해자가 존재하고 의도적으로 그 성과의 일부 혹은 전부를 자기 것처럼 발표한 경우에 한정해서 사용되어야 한다. 예를 들어 ‘카피킬러’ 프로그램으로 계산되는 기존 문헌과의 유사도 수치를 ‘표절률’이라고 부르는 것은 잘못이다. 훔친 것은 훔친 것이지 ‘절도율’이 몇 퍼센트인가를 따질 수 없는 것과 마찬가지다. 표절 여부는 이런 관점에서 신중하게 판단되어야 하고, 명백한 표절은 혹독하게 처벌해야 한다. 물론 제자의 학위논문 내용을 자기 연구처럼 발표한 교수, 타인의 논문 여러편을 짜깁기해 학위를 받은 스타 강사, 남의 학위 논문을 조잡하게 요약해서 자기 이름으로 학술지에 투고한 전 대통령 부인 등의 사례는 어떤 기준을 적용한다 하더라도 표절이 맞다.

근래에는 새로운 유형의 ‘세상에 나와서는 안 되는 논문’들이 등장했다. 학술지에 투고된 논문에서 실제로는 존재하지 않는 가짜 참고 문헌들이 인용되는 사례가 늘고 있는 것이다. 환각 인용(hallucinated citation)이라 불리는 이 현상의 규모는 충격적이다. 코넬대학 연구진이 주도한 최근의 검증 결과에 따르면, 조사 대상인 250만편의 논문 가운데 2025년 한해에만 14만6932건의 허위 인용이 확인되었다. 이 수치는 생성형 인공지능 활용이 일반화된 2024년 하반기를 기점으로 급증했다. 인공지능 도구는 선행 연구를 조사하는 데 있어 기존의 키워드 검색에 비해 대단히 효율적이지만, 투고자가 그 출력물을 제대로 검토하지 않아 거대 언어 모델의 약점인 환각 현상이 통제되지 않은 것이다.

표절의 피해자들이 자기 이름이 지워진 채 글을 빼앗겼다면, 환각 인용의 피해자들은 자기가 쓰지도 않은 글을 인용당하고 있는 셈이다. 나아가 실제 저자가 존재하지 않는 글이 주석에 실리는 경우는 ‘피해자’가 누구인지조차 불분명하다. 이런 상황을 기술 발전 탓으로 돌리고 싶은 유혹도 들지만, 인공지능이 없던 시절에도 제대로 읽지 않은 글을 자의적으로 곡해하여 인용하고 그것이 동료 평가 과정에서 걸러지지 않는 경우는 있었다. 그러나 기술의 도움을 받아 가짜 참고 문헌들로 손쉽게 양산된 논문들이 폭증한다면, 학계의 검증 시스템에 심각한 부하가 걸릴 것은 분명하다. 이런 도전에 대한 대응의 출발점은 연구자가 자신의 이름을 건 성과물에 책임을 지고, 그것이 인류의 지식을 확장한다는 전통적 학문 체제 본연의 기능을 재확인하는 것이다. 인공지능의 시대에도 인간 연구자의 책무는 사라지지 않는다.

한겨레

사설칼럼

표절, 그리고 환각 인용 [한승훈 칼럼]