이재명 언급량, 윤석열보다 4.5배 많았다 [빅데이터 분석]

이가현,강보현 2021. 11. 29. 04:04
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

대장동 언급량, 고발사주의 11배
둘 다 긍정보다 부정적 단어 많아


내년 대선이 29일로 정확히 100일 앞으로 다가온 상황에서 빅데이터는 어떤 비밀을 품고 있을까.

국민일보는 빅데이터 추출 서비스를 통해 최근 3개월간 이재명 더불어민주당 대선 후보와 윤석열 국민의힘 대선 후보의 관련 빅데이터를 분석했다. 다음소프트의 썸트렌드와 네이버 데이터랩, 구글 트렌드를 활용했다.

그 결과 이 후보의 언급량과 검색량은 윤 후보보다 훨씬 높았던 것으로 나타났다. 특히 이 후보를 둘러싼 대장동 개발사업 특혜 의혹이 윤 후보가 연루된 고발 사주 의혹보다 압도적으로 많은 언급량과 검색량을 보였다.

공통점도 있었다. 두 후보 모두 언급되는 단어 중 부정 단어가 긍정 단어보다 압도적으로 많았다. 역대급 비호감 대선이라는 점을 빅데이터도 가리키고 있는 것이다.


썸트렌드에 따르면 이 후보의 언급량은 윤 후보의 언급량에 비해 약 4.5배 많았다. 인스타그램과 트위터, 포털 뉴스, 네이버 블로그에서 해당 키워드가 얼마나 많이 언급됐는지를 썸트렌드가 추출한 결과다.

지난 8월 17일부터 지난 27일까지 이 후보가 언급된 횟수는 총 993만3304건이었다. 반면 윤 후보가 언급된 횟수는 총 220만4285건이었다. 두 후보 모두 경선에서 승리한 당일 또는 다음 날에 언급량이 가장 많았다. 이 후보는 다음 날인 10월 11일(17만5655건), 윤 후보는 당일인 11월 5일(5만9311건)에 각각 언급량의 최대치를 기록했다. 최대량 또한 이 후보가 윤 후보보다 2.9배 높았다.

사용자들이 직접 포털을 검색한 횟수를 추출하는 네이버 데이터랩과 구글 트렌드도 비슷한 양상을 보였다. 이 후보의 검색량이 윤 후보보다 많았다. 두 후보 모두 10월 들어 언급량과 검색량이 동시에 하락하는 추세를 보이고 있다.

두 후보의 약점으로 지목되는 대장동 의혹과 고발 사주 의혹 관련 빅데이터는 더욱 큰 격차를 보였다. 대장동만을 언급한 횟수는 모두 260만3518건에 달했다. 고발 사주 언급량은 22만9646건에 불과했다. 대장동의 언급량이 고발 사주에 비해 11배 많았다. 또 ‘이재명’과 ‘대장동’을 함께 언급한 양은 112만9184건이었다. 반면 ‘윤석열 김건희’ ‘윤석열 장모’라는 두 종류의 키워드로 언급한 횟수의 합은 17만7460건에 그쳤다.


검색량에서도 대장동이 고발 사주를 크게 앞섰다. 가중치로 검색량을 나타내는 네이버 데이터랩의 경우 대장동의 최대치가 100이었고 고발 사주의 최대치는 36에 그쳤다. 대장동 의혹에 관한 검색이 고발 사주 의혹보다 3배 가까이 더 많았다는 의미다.

이 후보와 윤 후보를 표현하는 단어를 분석한 결과 두 사람 모두 부정적 의미의 단어가 긍정보다 훨씬 많았다. 긍정 단어가 함께 언급되는 비율은 10%대에 머물렀고, 부정 단어가 함께 언급되는 비율은 70~80%대를 상회했다. 어떤 후보가 부정적 단어가 더 많은지는 분류하는 게 사실상 무의미했다. 두 사람 모두 긍정·부정 단어 비율이 엎치락뒤치락했기 때문이다.

이 후보와 관련된 단어 중 부정어는 ‘의혹’ ‘범죄’가 있었고 ‘음주운전’ ‘적폐’ 등이 있었다. 윤 후보 또한 ‘의혹’ ‘범죄’가 있었고 ‘망언’ ‘논란’도 추출됐다. 이 후보의 긍정어는 ‘지지하다’ ‘무료’가, 윤 후보는 ‘잘하다’ ‘지지하다’가 검색됐다.

전문가들은 언급량과 검색량만으로는 특정 후보의 유불리를 따질 수 없다고 강조한다. 다만 유권자들이 윤 후보 관련 의혹보다 이 후보의 대장동 의혹에 더 많이 노출됐던 것은 부인할 수 없는 사실이다.

김형준 명지대 인문교양학부 교수는 “2017년 대선 당시 문재인 후보는 언급량과 긍정적 언어가 모두 높게 나타났다”면서 “이 후보의 경우 언급량은 많지만 지지율이 높지 않다는 건 여전히 부정적 언어가 많이 따라붙고 있다는 것을 의미한다”고 분석했다.

하지만 조진만 덕성여대 정외과 교수는 “이 후보의 경우 고정적이고 결속력 있는 지지층이 있어서 대장동 의혹을 반박하거나 방어하기 위한 움직임이 있을 수 있다”고 봤다.

이 후보에 대한 관심도를 증명하는 것이라는 분석도 있다. 박상병 인하대 정책대학원 교수는 “집권 여당 후보이기 때문에 이 후보의 행보에 대한 관심이 더욱 클 수밖에 없다”면서 “윤 후보의 경우 최근 김종인 전 비대위원장과의 잡음을 제외하고는 관심을 끌 만한 이슈가 없었다”고 말했다.

두 후보 모두 언급량과 검색량이 줄어드는 것에 주목해야 한다는 의견도 있었다. 이강윤 한국사회여론연구소 소장은 “두 후보 모두 부정 추이가 높고, 언급량과 검색량이 준다는 것은 두 후보 모두에게 흥미를 잃는 것을 방증하는 결과”라고 강조했다.

이가현 강보현 기자 hyun@kmib.co.kr

GoodNews paper ⓒ 국민일보(www.kmib.co.kr), 무단전재 및 수집, 재배포금지

Copyright © 국민일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?