생성AI 시대의 그늘, 인터넷이 ‘가짜의 바다’ 될라
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
인공지능이 검색 서비스와 결합하면서 인터넷 생태계에 지각 변동이 예고되고 있다.
인터넷 생태계를 좌우하던 검색엔진의 사업모델이 요동치고, 생성 인공지능이 만들어내는 콘텐츠와 가짜, 무의미한 가공물이 인터넷에 넘쳐나는 데 따른 현상이다.
거대언어모델 기반의 인공지능엔 고품질 데이터가 필수적이어서 데이터의 가치가 높아지고 있는데, 인터넷의 상당 공간이 무의미한 콘텐츠로 넘쳐난다면 인공지능이 학습할 수 있는 데이터가 아예 소멸해버릴 우려도 있다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
구글, 검색결과에 인공지능 결합
사이트 직접 방문할 동기 감소해
콘텐츠 생태계 고사할 우려
황당한 오답 사례도 잇따라
인공지능이 검색 서비스와 결합하면서 인터넷 생태계에 지각 변동이 예고되고 있다. 인터넷 생태계를 좌우하던 검색엔진의 사업모델이 요동치고, 생성 인공지능이 만들어내는 콘텐츠와 가짜, 무의미한 가공물이 인터넷에 넘쳐나는 데 따른 현상이다. 사람이 만들고 축적해온 정보의 바다를 생성 인공지능이라는 자동 무한 생성기계가 오염시킬 수 있다는 우려가 제기된다.
흔들리는 검색 모델과 웹생태계
순다 피차이 구글 최고경영자는 지난달 14일 열린 ‘구글I/O 2024′에서 “구글 검색을 완전히 개편한 ‘인공지능 개요(AI Overview)’를 출시한다”고 발표했다. 이용자가 ‘채식주의자를 위한 식단 옵션’ 또는 ‘마이애미 당일 여행’ 같은 검색어를 입력하면 구글의 인공지능인 제미나이가 만든 답변이 검색 결과 화면 위쪽에 나타나는 방식이다.
구글이 장악하고 있는 인터넷 검색 서비스는 지금까지 ‘검색어 입력’ 기반이었다. 이용자가 검색창에 물으면 적합도와 시의성 등을 반영한 알고리즘에 따라 제공되는 검색 결과 링크를 눌러서 외부 사이트로 이동하는 구조다. 구글은 검색 결과를 보여주고, 콘텐츠를 제공한 웹사이트는 트래픽을 받는 게 현재의 웹 생태계 구조다.
검색 결과를 클릭해서 외부 사이트로 이동할 필요없이 ‘인공지능 개요’만으로 정보 수요를 충족시킨다면 웹 생태계는 요동치게 된다. 이용자가 외부 사이트를 직접 방문하는 경우가 크게 줄어들 수 있기 때문이다. 언론사를 비롯한 콘텐츠 제공자(CP) 생태계가 사막화할 수 있다.
미국의 컨설팅기업인 가트너는 지난 2월19일 “검색 엔진을 통한 웹 트래픽이 인공지능 챗봇과 가상비서 영향으로 2026년까지 5%가량 감소할 것”이라고 예측한 바 있는데, 구글과 같은 검색업체의 서비스 전략 변경을 가속화하고 있는 상황이다.
그런데 구글의 ‘인공지능 개요’ 서비스는 첫발부터 헛디뎠다. “미국에 몇 명의 무슬림 대통령이 있느냐”는 질문에는 “최초의 무슬림 미국 대통령은 버락 오바마”라고 답했다.
피자에서 치즈가 분리되는 걸 피하는 요령에 대한 질의에는 “소스에 접착제를 바르라”는 ‘개요’를 제공했다. 이는 인터넷 커뮤니티 ‘레딧’에 올라온 농담을 인공지능 검색이 긁어와 생긴 오답으로 보인다는 추측이 제시됐다. “하루에 몇 개의 돌을 먹어야 하나”라는 질문
엔 “사람이 하루에 적어도 한 개의 작은 돌을 먹어야 한다”는 개요를 제시했다. 이미지를 구긴 구글은 부랴부랴 수동으로 답변 내용 수정에 나섰다.
가짜·무의미 정보 넘쳐나
‘죽은 인터넷’이론 다시 주목
생성AI와 ‘죽은 인터넷’
생성 인공지능은 인터넷을 아예 무가치한 정보가 판치는 곳으로 만들 수 있다는 우려도 나온다.
지난달 오스트레일리아의 제이크 렌젤라 뉴사우스웨일즈대 강사는 ‘죽은 인터넷 이론’에 관한 글을 ‘컨버세이션’에 기고했다. ‘죽은 인터넷’ 이론은 “(봇과 상업조직들의 활동으로) 인터넷이 사실상 사망했다”는 일종의 음모론으로 여겨졌는데, 인공 지능으로 인해 다시 주목해야 한다는 주장이다.
렌젤라 등은 페이스북에서 ‘새우 예수(shrimp Jesus)’를 검색하면 나오는 황당한 합성 이미지를 사례로, 인공지능이 변화시키고 있는 인터넷의 실상을 지적했다. 특히 사람이 인공지능으로 만든 것만이 아니라 인공지능이 자체적으로 계정을 개설해 콘텐츠를 자동 생성하는 현상을 짚었다. 인공지능 계정은 인스타그램·틱톡 같은 소셜미디어 플랫폼에서 참여(클릭·좋아요·댓글)를 유도하기 위해 인공지능이 생성한 이미지와 함께 게시물을 빠르게 생성하는 기능도 수행한다. 이들은 또한 최근에는 수많은 인공지능 계정을 관리하고 조종하는 역할도 인공지능 에이전트가 수행하고 있는 것으로 보인다고 주장했다.
‘새우 예수’ 콘텐츠가 생성된 배경에 대해선 소셜미디어에서의 광고 수익 추구가 지목됐다. 보안업체 탈레스의 지난 4월 보고서에 따르면, 지난해 전체 인터넷 트래픽의 거의 절반(49.6%)이 봇(로봇)에 의한 것이다. 그중에서도 악성 봇에 의한 웹 트래픽의 비율은 2022년 30.2%에서 2023년 32%로 증가했다.
오픈에이아이의 챗지피티(GPT) 모델과 구글 제미나이 같은 생성형 인공지능으로 가짜 콘텐츠와 딥페이크의 품질은 더욱 정교해져 사람이 구분하기 어려워진다. 전문기관들은 선진국 시민 대부분은 진짜 정보보다 가짜 정보를 더 많이 접하게 될 것이라고 경고한 바 있다.
인터넷은 사람에 의해 설계되고 그 내용이 채워지는 등 인간 활동의 중심지였는데 인공지능 봇들의 활동으로 인해 빠르게 변화하고 있으며 그 영향은 ‘죽은 인터넷’이 경고하는 것처럼 암울하다. 인공지능이 만들어낸 챗봇과 활동이 인터넷을 무의미한 정보가 넘쳐나는 ‘죽음의 공간’으로 만들 수 있다는 우려는 인공지능 기술 발달도 방해할 수 있다. 거대언어모델 기반의 인공지능엔 고품질 데이터가 필수적이어서 데이터의 가치가 높아지고 있는데, 인터넷의 상당 공간이 무의미한 콘텐츠로 넘쳐난다면 인공지능이 학습할 수 있는 데이터가 아예 소멸해버릴 우려도 있다.
구본권 사람과디지털연구소장 starry9@hani.co.kr
Copyright © 한겨레신문사 All Rights Reserved. 무단 전재, 재배포, AI 학습 및 활용 금지
- [단독] “아빠가 김앤장 소개, 친구들 놀라”…고위직 자녀 포섭하나
- 의사협회 18일 집단휴진…“전공의 사직과 차원이 다른 공포”
- 스티커 붙이다가 죽는 서울 지하철…“남편 생전에 인력부족 토로”
- 교수 과외하면 대입 실기 높은 점수…서울대 음대도 입시비리
- 경찰도 밀양시도 “자칫 잘못하면…” ‘신상 공개’ 고소·진정에 난감
- 하루살이가 많아졌다고? 오히려 줄었다…문제는 인간인 것을
- 이재명 “코로나 대출금 10년 이상 장기분할상환법 제정”
- 우리 푸바오, 잘 지냈나 확인해야지…D-2 일반공개
- 정부 “개원의 진료 명령”…18일 예고된 집단휴진 ‘불법’ 규정
- 윤 대통령, 중앙아시아 3개국 순방 출국…김건희 여사 동행