'부산대 걸작' 맞춤법 검사기에 신문 20년치 데이터 돌린 사람

남해인 기자 2023. 7. 14. 05:07
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

부산대 인공지능연구소가 개발한 한국어 맞춤법 검사기를 최근 특정 IP(인터넷 접속 주소)가 한달에 500만회 이상 비정상적으로 사용한 것으로 파악됐다.

대학 연구물을 인공지능(AI) 학습에 무단 이용하는 사례가 속속 나오지만 아직 이를 제재할 명확한 규제나 사용 대가에 관한 가이드라인이 미비해 보완책을 마련해야 한다는 지적이 나온다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

이용량 하루 100만→1600만건…AI 언어학습 이용 추정
연구물 등 무단 사용 방지 위한 규제·사회적 합의 필요
13일 부산대에 따르면 맞춤법 검사기를 거대 언어 모델 학습을 하는 것으로 의심되는 특정 IP들이 비정상적으로 이용해 평소보다 70% 증가한 클라우드 비용이 청구됐다. 사진은 부산대 맞춤법 검사기 웹사이트 화면 갈무리.ⓒ 뉴스1

(서울=뉴스1) 남해인 기자 = 부산대 인공지능연구소가 개발한 한국어 맞춤법 검사기를 최근 특정 IP(인터넷 접속 주소)가 한달에 500만회 이상 비정상적으로 사용한 것으로 파악됐다.

대학 연구물을 인공지능(AI) 학습에 무단 이용하는 사례가 속속 나오지만 아직 이를 제재할 명확한 규제나 사용 대가에 관한 가이드라인이 미비해 보완책을 마련해야 한다는 지적이 나온다.

14일 부산대에 따르면 맞춤법 검사기를 거대 언어 모델 학습에 이용하는 것으로 의심되는 특정 IP들이 비정상적으로 이용해 평소보다 70% 증가한 클라우드 비용이 청구됐다.

부산대 측은 맞춤법 검사기에 공지를 내고 "검사기 서비스는 개인이나 학생에게 비상업적 용도로만 무료로 제공하는 서비스"라며 "이용 패턴을 꾸준히 점검해 상업적 이용과 대규모 데이터 수집 목적의 이용을 제한하겠다"고 밝혔다.

부산대와 부산의 IT(정보기술) 중소기업 나라인포테크가 운영하는 이 검사기는 1991년 개발돼 2001년에 무료로 공개됐다. 빠른 속도로 정확하게 맞춤법 검사를 할 수 있어 '부산대 걸작'으로도 불려왔다.

검사기를 개발한 권혁철 부산대 정보컴퓨터학부 교수는 "평소 하루에 7만명이 100만건 정도를 사용했는데 이번엔 1600만건이 사용됐다"며 "누군가 신문 20년치 분량의 데이터를 맞춤법 검사기에 적용해 몰래 사용한 것"이라고 말했다.

마이크로소프트·구글 등 글로벌 빅테크와 네이버·카카오 등 국내 주요 IT 기업이 생성형 AI 개발에 나서면서 대학 연구물을 포함한 데이터 무단 학습 우려가 커지고 있다.

특히 대학 연구물은 연구진이 오랜 기간 상당한 노력과 예산을 들여 내놓는 만큼 보호할 필요성이 더욱 크다는 지적이 나온다.

현재 '챗GPT'나 '바드'에 '한국 논문을 추천해달라'고 영문으로 입력하면 실제 존재하는 논문의 영문 제목과 영문 저자명, 해당 논문을 요약한 내용을 보여준다.

라이선스가 없는 일반인이 논문을 조회하기 위해서는 통상 비용을 지불해야 하는데 '챗GPT'나 '바드'가 이런 절차 없이 해당 논문을 이미 학습했다는 의미다.

그러나 대학 연구물에 대한 심각한 저작권 침해나 무단 사용이 발생할 경우 실현 가능한 대응 방안은 민사 소송이 전부다.

김경환 법무법인 민후 변호사는 "약관에 상업적으로 무단 사용하면 안 된다는 내용을 명시했을 경우 해당 내용 위반으로 다투거나 상당한 노력이 들어간 대학 연구물을 무단 활용한 점을 부정경쟁 행위로 볼 여지도 있다"고 설명했다.

또 "논문 등 연구물 내용을 생성형 AI가 그대로 노출하거나 이를 활용해 새로운 저작물을 보여주는 경우 저작권법 위반 여지도 있다"고 밝혔다.

사후 대응 방안인 법적 규제 외에도 사전 예방할 수 있는 가이드라인이 필요하다는 지적이 나온다.

권혁철 교수는 "다른 사람의 연구물을 상업적 목적으로 무단 활용하는 행위는 잘못된 것이라는 사회적 합의와 가이드라인을 마련해야 한다"고 말했다.

hi_nam@news1.kr

Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.

이 기사에 대해 어떻게 생각하시나요?