부산대 맞춤법 검사기 유료화되나..."특정 IP 비정상 접근"

정지윤 기자 2023. 7. 6. 18:59
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

부산대가 '한국어 맞춤법·문법 검사기'에 최근 특정 IP 주소로부터 한달 반 동안 500만 건에 달하는 비정상 사용 정황을 포착했다.

6일 부산대 인공지능연구실에 따르면 최근 한국어 맞춤법·문법 검사기에 특정 IP 주소로부터 한달 반 동안 500만 회 이상 비정상 접근이 이뤄졌다.

경기도의 한 아파트로 추정되는 해당 IP 주소가 사용한 검색량은 전체 이용자의 한 달 검색량(1000만 건)의 절반 수준이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

12년째 무료 공개된 프로그램
누군가 한달 반에 500만건 사용
연구실 서버 요금 두 배로 올라
"계속된다면 유료화 불가피"도

부산대가 ‘한국어 맞춤법·문법 검사기’에 최근 특정 IP 주소로부터 한달 반 동안 500만 건에 달하는 비정상 사용 정황을 포착했다. 이는 검사기 전체 이용자가 한 달 동안 입력하는 방대한 양이다. 부산대는 대용량 데이터 처리가 계속된다면, 서버 비용을 감당할 수 없어 무료 서비스를 지속하기 힘들다는 입장이다.

한국어 맞춤법·문법 검사기 화면.


6일 부산대 인공지능연구실에 따르면 최근 한국어 맞춤법·문법 검사기에 특정 IP 주소로부터 한달 반 동안 500만 회 이상 비정상 접근이 이뤄졌다. 경기도의 한 아파트로 추정되는 해당 IP 주소가 사용한 검색량은 전체 이용자의 한 달 검색량(1000만 건)의 절반 수준이다.

인공지능연구실은 자체 조사를 거쳐 해당 IP 주소가 거대 언어 모델의 학습(딥러닝)을 목적으로 검사기를 이용한 것으로 추정한다. 연구실은 사람이 직접 입력할 수 없는 방대한 양이고, 전체 사용량은 늘었지만 개별 이용자의 오류 수정이나 건의사항 등 피드백 건수는 변화 없어 기계가 매크로(자동) 방식으로 학습한 것으로 짐작했다.

문제는 검색기를 과다 사용하면서 연구실이 서버 이용 요금 폭탄을 맞아 클라우드 서버 이용 요금이 2배 이상 뛰었다는 점이다. 검사기는 비상업적 용도라면 무료 서비스로 사용자 편의를 위해 상업 광고 개시도 하지 않는다.

한국어 맞춤법문법 검사기 화면.


한국어 맞춤법문법 검사기 화면.


특정인이 검사기를 이용해 기계학습을 했다면, 천문학적 비용이 드는 기계 학습을 정당한 대가를 치르지 않고 무단 사용한 셈이다. 학습에 필요한 30만 건의 언어 데이터를 확보하려면 최소 15억 정도가 드는 것으로 알려졌다.

연구실은 앞으로도 대용량 데이터 처리가 계속되면, 서비스 속도가 느려져 다른 이용자가 피해를 볼 수 있고 무료 서비스 제공이 불가능해진다는 입장이다. 이날 사회관계망서비스(SNS)에는 ‘맞춤법 검사기’가 실시간 검색어로 오르고, 한 누리꾼이 “부산대 맞춤법 검사기만 쓰는데, 누군지 몰라도 데이터 훔치지 말라”고 쓴 게시물이 132만 조회수를 기록했다.

검사기를 개발한 부산대 권혁철(정보컴퓨터공학부) 교수는 “챗GPT와 비교하면 문법적 오류 수정과 외래어 표현, 유행어 수정 분야에서 검사기의 강점이 확실하다”며 “서비스 이용 패턴을 꾸준히 점검해 상업적 이용과 대규모 데이터 수집을 제한하겠다”고 밝혔다.

한편, 검사기는 1991년 권 교수가 개발해 2001년 무료 공개한 국내 최초 맞춤법 검사기다. 한글과컴퓨터의 문서프로그램 ‘아래아 한글’의 맞춤법 검사 기능도 여기에 기반한다. 부산대 학생뿐만 아니라, 전국 대학생, 언론사까지 광범위하게 사용해 대규모 공채 접수 마감일에는 서버가 다운될 정도다.

Copyright © 국제신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?