7월 서울 개최 국제학회 논문 497편 탈락…"AI로 리뷰 작성한 저자들 논문"

국제기계학습학회, 규정 위반 사례 적발

국제기계학습학회(ICML)가 심사용 논문에 숨긴 워터마크로 AI 리뷰 작성자를 잡아냈다. 규정을 어긴 저자들의 논문 497편이 탈락했다. 게티이미지뱅크 제공

국제기계학습학회(ICML)가 심사용 논문에 워터마크를 숨겨 생성형 인공지능(AI) 사용을 탐지한 결과 규정 위반 사례를 적발했다.

25일(현지시간) 국제학술지 '네이처' 보도에 따르면 오는 7월 6일부터 11일까지 서울 코엑스에서 열릴 예정인 ICML이 동료 평가에서 대형언어모델(LLM)을 사용해 리뷰를 작성한 저자들의 논문 497편을 탈락시켰다. 전체 제출 논문의 약 2%다.

ICML은 상호 리뷰 정책을 운영한다. 특별한 경우를 제외하면 모든 논문 저자가 다른 논문을 심사해야 한다. 학회는 이 과정에서 LLM 사용 규정을 어긴 리뷰를 제출한 저자들의 논문을 탈락 처리했다.

학회는 올해 처음으로 리뷰 트랙을 둘로 나눴다. LLM 사용을 제한적으로 허용하는 트랙과 엄격히 금지하는 트랙이다. 저자와 리뷰어가 원하는 트랙을 직접 골랐으며 AI 사용 금지 의무는 금지 트랙을 선택한 사람에게만 적용됐다.

적발에는 지난해 발표된 워터마크 기술을 활용했다. 심사용 논문에 LLM만 인식할 수 있는 숨은 지시문을 통해 AI가 리뷰 작성 시 특정 문구 두 개를 포함하도록 유도하는 방식이다. 문구는 약 17만 개 문장 라이브러리에서 무작위로 선택된다.

예컨대 '이 논문의 핵심 아이디어는'과 '이 연구가 다루는 중요한 개념은' 같은 문장이 리뷰에 동시에 등장하면 AI 사용으로 판단한다. 두 문구가 우연히 함께 나타날 확률은 극히 낮으며 탐지된 사례는 모두 수동 검토도 거쳤다.

그 결과 전체 리뷰 건수의 약 1%인 795건에서 LLM 사용이 적발됐고 해당 저자들의 논문 497편이 탈락했다.

다만 학회 측은 이 방법이 "가장 노골적이고 부주의한 AI 사용만 잡아낼 수 있다"고 인정했다. AI가 항상 지시를 따르지 않고, 워터마크 존재를 알면 우회도 가능하기 때문이다.

학회 운영진은 지난 18일 블로그에서 "빠르게 변화하는 분야에서 가장 적극적으로 지켜야 할 것은 서로에 대한 신뢰"라며 강경 조치의 취지를 밝혔다. 많은 연구자가 이번 조치를 환영하며 다른 학회도 참고해야 한다고 했다. 일부는 탈락 저자의 재투고 금지 등 더 강한 제재를 제안했다.

반면 정정중 투 미국 텍사스A&M대 컴퓨터과학자는 네이처에 "리뷰어들의 의욕을 떨어뜨리고, AI 사용을 금지하면 의미 없는 리뷰를 생성하는 방향으로 갈 수 있다"며 실효성에 의문을 제기했다.

동료 평가에서 AI 활용은 이미 보편화됐다. 학술 출판사 프런티어스가 지난해 실시한 설문에서 연구자 절반 이상이 AI를 사용한 경험이 있다고 답했다. 학술지와 학회가 금지하는 경우가 많지만 현장에서는 광범위하게 쓰이고 있어 연구자들 사이에서도 의견이 엇갈린다.

학회는 이번 조치가 AI 도구의 신뢰성 문제가 아니라 연구 윤리의 문제라고 강조했다. "적발된 리뷰의 질이나 리뷰어의 의도를 평가하려는 것이 아니다"라고 밝혔다.

[조가현 기자 gahyun@donga.com]

동아사이언스

IT/과학

7월 서울 개최 국제학회 논문 497편 탈락…"AI로 리뷰 작성한 저자들 논문"