부산대 맞춤법 검사기에 500만 건 비정상 접근…"AI 학습에 악용"

유영규 기자 2023. 7. 7. 09:57
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

부산대가 20년 넘게 무료로 제공 중인 '한국어 맞춤법·문법 검사기'에 최근 특정 IP 주소로부터 수백만 건의 비정상적인 사용 정황이 포착됐습니다.

오늘(7일) 부산대 인공지능연구실에 따르면 지난 3월 초부터 4월 중순까지 한 달여 동안 경기 남부지역의 한 아파트로 추정되는 IP 주소에서 이 검사기에 500만 건 이상의 접근이 이뤄졌습니다.

그 결과 해당 IP 주소가 '딥러닝'을 위해 매크로 방식으로 검사기를 이용한 것으로 추정됐습니다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.


부산대가 20년 넘게 무료로 제공 중인 '한국어 맞춤법·문법 검사기'에 최근 특정 IP 주소로부터 수백만 건의 비정상적인 사용 정황이 포착됐습니다.

오늘(7일) 부산대 인공지능연구실에 따르면 지난 3월 초부터 4월 중순까지 한 달여 동안 경기 남부지역의 한 아파트로 추정되는 IP 주소에서 이 검사기에 500만 건 이상의 접근이 이뤄졌습니다.

이는 일간지 20년 치 분량으로 검사기 전체 이용자의 한 달 검색량의 절반에 해당하는 수준입니다.

검사기를 개발한 권혁철 부산대 정보컴퓨터공학부 교수는 "해당 아파트 거주자가 벌인 일은 아닌 것 같고, 누군가가 해당 IP를 해킹한 것으로 보인다"며 "문제의 IP를 차단했다"고 설명했습니다.


인공지능연구실은 해당 기간 서버 이용 요금이 갑자기 2배 이상 증가한 것을 수상히 여겨 조사를 벌였습니다.

그 결과 해당 IP 주소가 '딥러닝'을 위해 매크로 방식으로 검사기를 이용한 것으로 추정됐습니다.

실제 500만 건 이상의 사용에도 오류 수정이나 건의 사항 등 피드백 건수의 변화는 없었습니다.

인공지능(AI) 언어 학습에 필요한 30만 건의 데이터를 확보하려면 최소 15억 원이 드는 것으로 알려져 있는데 누군가가 무료 검사기를 악용했다는 분석이 제기됐습니다.

이런 일이 잦아지면 서비스 속도 저하로 다른 이용자가 피해를 볼 수 있고, 무료 서비스 제공에 차질이 발생할 수 있습니다.

권 교수는 "현재는 비정상적 접근이 없는 상태"라며 "서비스 이용 패턴을 꾸준히 점검해 상업적 이용과 대규모 데이터 수집을 제한할 계획"이라고 말했습니다.

한국어 맞춤법·문법 검사기는 1991년에 개발돼 2001년 무료 공개됐습니다.

한글과컴퓨터의 문서프로그램 '아래아 한글'의 맞춤법 검사 기능도 이 검사기에 기반하고 있습니다.

(사진=한국어 맞춤법 검사기 화면 캡처, 연합뉴스)

유영규 기자 sbsnewmedia@sbs.co.kr

Copyright © Copyright ⓒ SBS. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?