"AI가 쓴 댓글 찾아낸다"…한국어 AI 생성글 탐지 기술 개발

김종서 기자 2025. 6. 23. 21:32
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

카이스트 연구팀 "AI 기반 여론 조작 대응 기술 마련"
XDAC 데모 탐지 및 식별 시연 예시(KAIST 제공) /뉴스1

(대전=뉴스1) 김종서 기자 = 한국과학기술원(KAIST)은 전기및전자공학부 김용대 교수 연구팀이 국가보안기술연구소와 협력해 한국어 인공지능(AI) 생성 댓글 탐지 기술 'XDAC'를 세계 최초로 개발했다고 23일 밝혔다.

최근 생성형 AI는 뉴스 기사 맥락에 맞춰 감정과 논조까지 조절할 수 있으며 몇 시간 만에 수십만 개의 댓글을 자동 생성할 수 있어 여론 조작에 악용될 수 있다.

연구팀에 따르면 오픈AI의 GPT-4o API를 기준으로 하면 댓글 1개 생성 비용은 약 1원 수준이다. 국내 주요 뉴스 플랫폼의 하루 평균 댓글 수인 20만 개를 생성하는 데 단 20만 원이면 가능하고 사실상 무상으로 댓글 생성이 가능한 수단도 있다.

연구팀이 총 210개의 댓글로 사람이 AI 생성글을 구별할 수 있는지 실험한 결과, 67%를 사람이 작성한 것으로 착각했고 실제 사람 작성 댓글도 73%만 정확히 구분해냈다.

AI 생성 댓글은 오히려 기사 맥락 관련성·문장 유창성·편향성 인식에서 사람 작성 댓글보다 높은 평가를 받았다.

이에 연구팀은 △14종의 다양한 LLM 활용 △자연스러움 강화 △세밀한 감정 제어 △참조자료를 통한 증강 생성의 네 가지 전략을 적용한 AI 댓글 생성 프레임워크를 개발하고 이 중 일부를 벤치마크 데이터셋으로 공개했다.

또 설명 가능한 AI(XAI) 기법을 적용해 언어 표현을 정밀 분석한 결과, AI 생성 댓글에는 사람과 다른 고유한 말투 패턴이 있음을 확인했다.

예를 들어 AI는 "것 같다", "에 대해" 등 형식적 표현과 높은 접속어 사용률을 보였고 사람은 반복 문자(ㅋㅋㅋㅋ), 감정 표현, 줄바꿈, 특수기호 등 자유로운 구어체 표현을 즐겨 사용했다.

특수문자 사용에서도 AI는 전 세계적으로 통용되는 표준화된 이모지를 주로 사용하는 반면, 사람은 한국어 자음이나 특수 기호 등 문화적 특수성이 담긴 다양한 문자를 활용했다.

특히 줄바꿈, 띄어쓰기 등 서식 문자 사용에서 사람 작성 댓글의 26%는 이런 서식 문자를 포함했지만 AI 생성 댓글은 단 1%만 사용했다. 반복 문자 사용 비율도 사람 작성 댓글이 52%로, AI 생성 댓글(12%)보다 훨씬 높았다.

XDAC는 이러한 차이를 정교하게 반영해 탐지 성능을 높였다. 또 어떤 AI 모델이 댓글을 생성했는지도 식별 가능하게 설계됐다.

이러한 최적화로 XDAC는 AI 생성 댓글 탐지에서 98.5% F1 점수로 기존 연구 대비 68% 성능을 향상시켰다. 댓글 생성 LLM 식별에서도 84.3% F1 성능을 기록했다.

고우영 선임연구원은 "이번 연구는 생성형 AI가 작성한 짧은 댓글을 높은 정확도로 탐지하고 생성 모델까지 식별할 수 있는 세계 최초 기술"이라며 "AI 기반 여론 조작 대응의 기술적 기반을 마련한 데 큰 의의가 있다"고 강조했다.

이번 연구는 인공지능 자연어처리 분야 국제 학술대회 'ACL 2025' 메인 콘퍼런스에 채택되며 기술력을 인정받았다.

jongseo12@news1.kr

Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.