AI가 생성한 한국어 댓글 '꼼짝마'…KAIST, 탐지기술 세계 첫 개발

이채린 기자 2025. 6. 23. 20:02
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

생성형 인공지능(AI) 기술이 발전하면서 이를 악용한 온라인 여론 조작 우려가 커지고 있다.

한국 연구진이 AI가 영어가 아닌 한국어로 생성한 댓글을 탐지하는 기술을 개발했다.

KAIST는 김용대 전기 및 전자공학부 교수 연구팀이 국가보안기술연구소(국보연)와 협력해 한국어 AI 생성 댓글을 탐지하는 기술 'XDAC'를 세계 최초로 개발했다고 23일 밝혔다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

KAIST는 김용대 전기 및 전자공학부 교수 연구팀이 국가보안기술연구소(국보연)와 협력해 한국어 AI 생성 댓글을 탐지하는 기술 'XDAC'를 세계 최초로 개발했다. 게티이미지뱅크 제공

생성형 인공지능(AI) 기술이 발전하면서 이를 악용한 온라인 여론 조작 우려가 커지고 있다. 한국 연구진이 AI가 영어가 아닌 한국어로 생성한 댓글을 탐지하는 기술을 개발했다. 

KAIST는 김용대 전기 및 전자공학부 교수 연구팀이 국가보안기술연구소(국보연)와 협력해 한국어 AI 생성 댓글을 탐지하는 기술 'XDAC'를 세계 최초로 개발했다고 23일 밝혔다. XDAC는 한국어 뉴스 댓글에서 대규모언어모델(LLM)이 생성했는지 여부를 판별하고 출처를 추적하는 '설명 가능한 AI(XAI·Explainable AI)' 기반 탐지 기술이라는 뜻이다. 

그동안 AI 생성글 탐지 기술은 대부분 영어로 된 장문의 정형화된 글을 기반으로 개발되어 한국어의 짧은 댓글에는 적용이 어려웠다. 연구팀은 △14종의 다양한 LLM을 활용 △자연스러움 강화 △세밀한 감정 제어 △참조자료를 통한 증강 생성이라는 전략을 적용해 AI 댓글 생성 프레임워크를 개발했다. 

연구팀은 실제 이용자 스타일을 모방한 한국어 AI 생성 댓글 데이터셋을 구축하고 데이터셋 중 일부를 벤치마크 데이터셋으로 공개했다. XAI 기법을 적용해 언어 표현을 정밀 분석한 결과 AI 생성 댓글에는 사람과 다른 고유한 말투 패턴이 있다는 점이 확인했다.

예를 들어 AI는 '것 같다', '에 대해' 등 형식적 표현과 높은 접속어 사용률을 보였다. 사람은 반복 문자(ㅋㅋㅋㅋ), 감정 표현, 줄바꿈, 특수기호 등 자유로운 구어체 표현을 즐겨 사용했다.

특수문자 사용에서도  AI는 전 세계적으로 통용되는 표준화된 이모지를 주로 사용했다. 반면 사람은 ㅋ, ㅠ, ㅜ 등 한국어 자음이나 ㆍ, ♡, ★, • 등 특수 기호처럼 문화적 특수성이 담긴 다양한 문자를 활용했다. 

XDAC는 이러한 차이를 정교하게 반영해 탐지 성능을 높였다. 줄바꿈, 공백 등 서식 문자를 변환하고 반복 문자 패턴을 기계가 이해할 수 있도록 변환하는 방식이 적용됐다. 또 각 LLM의 고유 말투 특징을 파악해 어떤 AI 모델이 댓글을 생성했는지도 식별 가능하게 설계됐다.

연구팀의 최적화로 XDAC는 AI 생성 댓글 탐지 실험에서 98.5% 'F1 점수'로 기존 연구 대비 68% 성능을 향상시켰다. 댓글 생성 LLM 식별에서도 84.3% F1 성능을 기록했다. F1은 정확도와 재현율을 함께 고려해 AI 모델의 종합적인 성능을 판단할 수 있는 지표다. 

연구팀은 XDAC의 탐지 기술이 단순 판별을 넘어 심리적 억제 장치로도 작용할 수 있다고 설명했다. 마치 음주단속, 마약 검사, CCTV 설치 등이 범죄 억제 효과를 가지듯 정밀 탐지 기술의 존재 자체가 AI 악용 시도를 줄일 수 있다는 것이다.

XDAC는 플랫폼 사업자가 의심스러운 계정이나 조직적 여론 조작 시도를 정밀 감시·대응하는 데 활용될 수 있다. 향후 실시간 감시 시스템이나 자동 대응 알고리즘으로 확장 가능성이 크다.

연구에 참여한 고우영 선임연구원은 "연구는 생성형 AI가 작성한 짧은 댓글을 높은 정확도로 탐지하고 생성 모델까지 식별할 수 있는 세계 최초 기술이다"며 "AI 기반 여론 조작 대응의 기술적 기반을 마련한 데 큰 의의가 있다"고 강조했다.

연구는 7월 27일부터 개최되는 AI 자연어처리 분야 국제학술대회인 '국제자연어처리학회(ACL) 2025' 메인 콘퍼런스에 채택되며 기술력을 인정받았다. 

[이채린 기자 rini113@donga.com]

Copyright © 동아사이언스. 무단전재 및 재배포 금지.