구글 검색 순위 올리는 '공략집' 유출, 사실이었다

실리콘밸리=윤민혁 특파원 2024. 5. 30. 09:09
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

검색 노출 순위를 결정하는 알고리즘이 담긴 내부 문서가 유출된 데 대해 구글이 '진품'임을 인정했다.

총 2500 페이지로 구글 검색 노출 순위를 결정하는 알고리즘이 세세히 담겼다.

문서에는 검색 순위 결정 방식만 담겨 구글 검색의 핵심 기능이 밝혀진 것은 아니다.

구글이 그간 안내해온 검색 순위 결정 기준과 실제 적용되던 알고리즘에 차이가 많다는 점도 특징적이다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

필립 쉰들러 구글 최고비즈니스책임자가 21일(현지 시간) 미국 마운틴뷰에서 열린 ‘구글 마케팅 라이브(GML) 2024’에 참석해 AI 마케팅 전략을 소개하고 있다. 윤민혁 기자
[서울경제]

검색 노출 순위를 결정하는 알고리즘이 담긴 내부 문서가 유출된 데 대해 구글이 ‘진품’임을 인정했다. 2500장에 달하는 문서에는 검색 노출의 기준이 세세히 안내 돼 있다. 그간 구글이 검색 알고리즘에 적용하지 않는다고 안내해 온 요소들이 실제로는 활용되고 있다는 점도 확인됐다.

29일(현지 시간) 테크전문지 더 버지는 구글이 유출된 내부 문서가 진짜임을 확인했다고 보도했다. 구글은 “오래됐거나 불완전한 정보를 기반으로 검색에 대한 부정확한 가정을 하지 않도록 주의해야 한다”고 밝혔다. 유출된 문서에 담긴 알고리즘이 실제 검색에 적용하던 ‘옛 버전’임을 인정한 셈이다.

‘구글 API 콘텐츠 웨어하우스’라는 제목의 이 문서는 지난 3월 개발자 플랫폼 깃허브에 잠시 올라온 뒤 삭제됐으나 사본이 남았다. 총 2500 페이지로 구글 검색 노출 순위를 결정하는 알고리즘이 세세히 담겼다. 알음알음 퍼진 소문에 문서를 접한 전직 구글 직원들이 문서가 진본임을 확인하기도 했다. 이에 침묵을 지켜오던 구글이 이날 유출 사실을 인정한 것이다.

문서에는 검색 순위 결정 방식만 담겨 구글 검색의 핵심 기능이 밝혀진 것은 아니다. 또 어떤 요소를 고려하는지만 설명돼 있을 뿐 가중치에 대한 내용은 없다. 다만 검색 상위 노출을 노리는 마케터·검색엔진최적화(SEO) 업계에게는 그간 알 수 없던 구글 검색의 비밀이 담긴 ‘공략집’이 될 수 있다.

구글이 그간 안내해온 검색 순위 결정 기준과 실제 적용되던 알고리즘에 차이가 많다는 점도 특징적이다. 구글은 그간 클릭 패턴과 크롬 사용자 데이터 등이 검색 순위에 영향을 끼치지 않는다고 설명해왔으나 실제로는 관련 데이터가 활용되고 있었다. 사용자가 검색을 통해 접속한 웹페이지에 오래 머물수록 노출 순위가 올라간다는 뜻이다. 코로나19나 선거, 여행과 관련된 검색 결과에는 화이트리스트를 적용함이 확인되기도 했다.

실리콘밸리=윤민혁 특파원 beherenow@sedaily.com

Copyright © 서울경제. 무단전재 및 재배포 금지.