묻지도 않고 내가 쓴 리뷰·댓글도 '싹쓸이'…"챗GPT, 악몽될 수도"

황국상 기자 2023. 2. 11. 09:20
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[MT리포트-생성 AI 시대, 한국은 어디로] 1-⑤

[편집자주] 사람처럼 대화하는 '생성AI 신드롬'이 거세다. 챗GPT 쇼크로 빅테크의 AI 개발경쟁이 불붙은 것은 물론, 우리 일상과 사회 각 분야로 AI가 빠르게 스며들고 있다. 이는 기존 관행과 질서에 상당한 변화와 충격을 몰고 왔다. 도구로서 효용성이 큰 반면, 대필과 표절 등 악용사례도 잇따른다. 생성AI 시대를 마주한 한국의 현주소와 논란, 그리고 대처법을 짚어본다.

/사진제공=이미지투데이

"챗GPT는 개인정보 데이터(Data Privacy)에는 악몽과도 같다. 단 한 번이라도 온라인에 포스팅한 적이 있다면 당신도 우려해봐야 한다."

연일 이슈를 몰고 다니는 챗GPT에 대해 불편한 시선을 보내는 이들도 늘고 있다. 호주 시드니대 비즈니스스쿨의 유리 겔(Uri Gal) 교수는 최근 더컨버세이션에 올린 기고문을 통해 빅테크 기업들이 AI(인공지능)을 두고 군비경쟁을 본격화하는 과정에서 개인정보와 관련한 위협이 경시되고 있다는 점을 지적했다.

겔 교수에 따르면 오픈AI가 챗GPT의 성능 고도화를 위해 활용한 단어의 수는 무려 3000억개에 이른다. 이는 출판된 서적이나 기사를 비롯해 각종 웹사이트 및 SNS(소셜미디어) 포스팅들이 있다. 여기에는 동의 없이 수집한 개인정보도 당연히 포함돼 있다.

겔 교수는 "블로그 게시물이나 제품 리뷰를 작성했거나 온라인 기사에 댓글을 달았다면 이 정보는 챗GPT에 의해 소비됐을 가능성이 높다"며 "챗GPT는 우리 중 그 누구에게도 우리의 정보를 사용할 수 있는지를 묻지 않았다"고 했다.

그는 "오픈AI는 더 빠른 응답시간과 새로운 기능에 대한 우선 접근권을 보장하는 유료 모델을 출시할 계획을 내놨고 이를 통해 오픈AI는 2024년까지 10억달러(약 1조2600억원) 규모의 수익을 창출할 것으로 예상된다"며 "오픈AI의 기업가치는 지난해 대비 2배 수준인 290억달러(약 36조6300억원)로 최근 인정받기도 했다"고 했다.

또 "오픈AI는 인터넷에서 스크랩한 데이터에 대해 비용을 지불하지 않았고 이를 생성한 개인이나 웹사이트 운영자, 기업은 아무런 보상을 못 받았다"며 "우리의 승인 없이 수집되고 사용된 데이터가 없었더라면 오픈AI의 기업가치 상승, 수익 전망은 그 어느 것도 가능하지 않았을 것"이라고 했다.

특히 오픈AI가 사용자의 IP(인터넷주소)와 브라우저 타입 및 설정, 사용자가 주로 사용하는 기능 및 수행하는 작업과 같은 웹사이트 활동 데이터까지 수집한다고 비판했다. 그는 "오픈AI는 웹사이트에서의 사용자 검색활동 등 정보를 시간대별로 수집하고 있다"며 "놀랍게도 오픈AI는 자신들이 수집한 사용자 개인정보를 당사자에게 알리지 않고 불특정 3자에게 제공할 수 있다고 밝히고 있다"고 지적했다. 사용자들이 자신의 정보가 오픈AI에 저장돼 있는지 확인하고 필요시 삭제를 요청할 수 있는 절차도 제공되지 않는다는 점도 거론했다.

실제 오픈AI는 저작권 침해와 관련해 법적 분쟁에 직면해 있다. 더버지(the Verge) 등 외신에 따르면 지난해 11월 오픈AI와 깃허브, MS(마이크로소프트) 등 3개사를 대상으로 한 집단소송이 제기됐다. 오픈AI 등은 법원이 원고들의 주장을 기각해달라는 의견서를 내기도 했다.

오픈AI의 GPT 기술을 이용해 만든 깃허브의 코파일럿(Copilot) 프로그램은 AI 기반 자동 코딩 프로그램이다. 깃허브는 2018년 MS에 인수된 바 있다.

쟁점은 코파일럿을 학습시키는 과정에서 기존 개발자들이 깃허브에 올렸던 수십억 줄 규모의 코딩 저작권을 침해했는지 여부다. 원고들은 오픈AI 등의 행태에 대해 "전례 없는 규모의 소프트웨어 해적질"이라고 지적한다. 이에 오픈AI와 깃허브 등은 원고들이 되레 오픈소스 원칙을 훼손하고 있다고 주장한다. 오픈소스 형태로 개발자들이 자발적으로 공유한 프로그램에 대해 저작권 침해를 운운하는 자체가 오픈소스 원칙과 배치된다는 것이다. 이 소송이 어떻게 진행될지에 따라 오픈AI의 행보에 큰 변화가 생길 수도 있다는 전망이 나온다.

황국상 기자 gshwang@mt.co.kr

<저작권자 ⓒ '돈이 보이는 리얼타임 뉴스' 머니투데이, 무단전재 및 재배포 금지>

Copyright © 머니투데이 & mt.co.kr, 무단 전재 및 재배포 금지

이 기사에 대해 어떻게 생각하시나요?