"AI가 쓴 댓글 찾아낸다"…한국어 AI 생성글 탐지 기술 개발

카이스트 연구팀 "AI 기반 여론 조작 대응 기술 마련"

(대전=뉴스1) 김종서 기자 = 한국과학기술원(KAIST)은 전기및전자공학부 김용대 교수 연구팀이 국가보안기술연구소와 협력해 한국어 인공지능(AI) 생성 댓글 탐지 기술 'XDAC'를 세계 최초로 개발했다고 23일 밝혔다.

최근 생성형 AI는 뉴스 기사 맥락에 맞춰 감정과 논조까지 조절할 수 있으며 몇 시간 만에 수십만 개의 댓글을 자동 생성할 수 있어 여론 조작에 악용될 수 있다.

연구팀에 따르면 오픈AI의 GPT-4o API를 기준으로 하면 댓글 1개 생성 비용은 약 1원 수준이다. 국내 주요 뉴스 플랫폼의 하루 평균 댓글 수인 20만 개를 생성하는 데 단 20만 원이면 가능하고 사실상 무상으로 댓글 생성이 가능한 수단도 있다.

연구팀이 총 210개의 댓글로 사람이 AI 생성글을 구별할 수 있는지 실험한 결과, 67%를 사람이 작성한 것으로 착각했고 실제 사람 작성 댓글도 73%만 정확히 구분해냈다.

AI 생성 댓글은 오히려 기사 맥락 관련성·문장 유창성·편향성 인식에서 사람 작성 댓글보다 높은 평가를 받았다.

이에 연구팀은 △14종의 다양한 LLM 활용 △자연스러움 강화 △세밀한 감정 제어 △참조자료를 통한 증강 생성의 네 가지 전략을 적용한 AI 댓글 생성 프레임워크를 개발하고 이 중 일부를 벤치마크 데이터셋으로 공개했다.

또 설명 가능한 AI(XAI) 기법을 적용해 언어 표현을 정밀 분석한 결과, AI 생성 댓글에는 사람과 다른 고유한 말투 패턴이 있음을 확인했다.

예를 들어 AI는 "것 같다", "에 대해" 등 형식적 표현과 높은 접속어 사용률을 보였고 사람은 반복 문자(ㅋㅋㅋㅋ), 감정 표현, 줄바꿈, 특수기호 등 자유로운 구어체 표현을 즐겨 사용했다.

특수문자 사용에서도 AI는 전 세계적으로 통용되는 표준화된 이모지를 주로 사용하는 반면, 사람은 한국어 자음이나 특수 기호 등 문화적 특수성이 담긴 다양한 문자를 활용했다.

특히 줄바꿈, 띄어쓰기 등 서식 문자 사용에서 사람 작성 댓글의 26%는 이런 서식 문자를 포함했지만 AI 생성 댓글은 단 1%만 사용했다. 반복 문자 사용 비율도 사람 작성 댓글이 52%로, AI 생성 댓글(12%)보다 훨씬 높았다.

XDAC는 이러한 차이를 정교하게 반영해 탐지 성능을 높였다. 또 어떤 AI 모델이 댓글을 생성했는지도 식별 가능하게 설계됐다.

이러한 최적화로 XDAC는 AI 생성 댓글 탐지에서 98.5% F1 점수로 기존 연구 대비 68% 성능을 향상시켰다. 댓글 생성 LLM 식별에서도 84.3% F1 성능을 기록했다.

고우영 선임연구원은 "이번 연구는 생성형 AI가 작성한 짧은 댓글을 높은 정확도로 탐지하고 생성 모델까지 식별할 수 있는 세계 최초 기술"이라며 "AI 기반 여론 조작 대응의 기술적 기반을 마련한 데 큰 의의가 있다"고 강조했다.

이번 연구는 인공지능 자연어처리 분야 국제 학술대회 'ACL 2025' 메인 콘퍼런스에 채택되며 기술력을 인정받았다.

jongseo12@news1.kr

사회