뉴스 알고리즘은 '정치적 쟁점'이 아니다
(지디넷코리아=김익현 미디어연구소장)또 다시 네이버 뉴스 알고리즘이 도마위에 올랐다. 국민의힘 박성중 의원실의 문제 제기로 시작된 이번 논쟁은 뉴스 검색 노출 알고리즘 조작과 정치권 외압설로 확대되고 있다.
네이버가 알고리즘 조정을 통해 보수 매체의 노출 순위를 낮췄다는 것이다.
급기야 방송통신위원회도 네이버 알고리즘이 공정 경쟁이나 이용자 이익에 반하는지에 대한 조사에 착수하기로 했다.
보수와 진보가 네이버 뉴스를 놓고 대립하는 건 새로울 것 없는 일이다. 선거 같은 대형 이벤트가 있을 때면 늘 ‘보수 편향’ ‘진보 편향’ 공방을 벌였다.
이번엔 ‘뉴스 검색 노출 알고리즘’이 쟁점이다. 안 그래도 요즘 미국과 유럽연합(EU)의 알고리즘 규제에 관심을 갖고 있던 터라 어떤 문제로 다투는 지 한번 살펴봤다.
■ 핵심 쟁점은 2021년 계열사 분리 알고리즘 적용
2019년 3월 네이버는 뉴스 검색에 페이지랭크(PageRank)를 적용했다. 페이지랭크는 구글 검색에 적용되는 알고리즘이다. 웹 사이트의 링크를 많이 받는 페이지가 인기가 있다는 가정 하에 점수 값을 부여하는 방식이다. (조금 단순하게 비유하자면 학계의 논문 인용 빈도와 비슷한 방식이라고 이해하면 된다.)
그런데 네이버는 2021년 8월 이 알고리즘을 살짝 수정했다. 계열사를 분리하고, 언론사 피인용 지수를 결합한 것이다. 그 결과 뉴스 검색 때 보수 매체 순위가 내려갔다는 것이다. TV조선 보도에 따르면 일반 언론사 중에선 MBC가 가장 높이 올라간 반면, 조선일보는 2위에서 6위로 내려갔다.
이 조치에 대해 네이버는 “(2019년 알고리즘은) 동일한 주소를 사용하는 웹사이트를 기준으로 값이 추출되기 때문에 계열사별 분리가 어려웠다”면서 “언론사 피인용 지수를 도입해 계열사간 점수값을 분리해 부여했다”고 설명했다.
네이버의 설명을 쉽게 풀면 이렇게 된다.
A언론사와 B언론사가 있다고 가정해보자. A언론사는 종합지, 경제지, 스포츠, 연예전문지를 갖고 있다. 반면 B언론사는 경제 전문 매체만 운영하고 있다.
2019년 알고리즘에선 A언론사는 계열사를 모두 합산한 점수로 페이지랭크가 부여됐다. 단일 매체인 B언론사보다 ‘페이지랭크’에선 조금 유리했다. 그런데 '계열사 분리' 적용 이후엔 A언론사는 계열사별로 별도 랭킹이 매겨지기 때문에 그 전에 비해 노출 순위가 떨어질 수밖에 없다.
(물론 이건 뉴스 노출 알고리즘의 다른 항목이 모두 같다는 전제 하에서 하는 이야기다. 네이버 설명에 따르면 언론사별 인기도는 노출 순서를 결정하는 20개 정도 알고리즘 팩터 중 하나에 불과하다. 그리고 '클러스터' 같은 것들이 오히려 더 중요한 역할을 한다.)
어떤 이용자가 네이버에서 경제 관련 기사를 검색했다고 가정해보자. 이 때 A 언론사의 스포츠, 연예 매체에 실린 경제 기사와 B언론사의 기사 중 어떤 것이 더 적합한 검색 결과일까? ‘통상적인 기준에 따르자면’ 아마도 경제 전문 매체의 기사가 더 먼저 나올 것으로 기대할 것이다. 그런데 2019년 알고리즘에선 다른 조건이 동일할 경우 A 언론사의 스포츠, 연예 매체가 조금 더 우대될 수도 있다.
2021년의 뉴스 검색 알고리즘 조정은 이런 부분을 반영하기 위한 것이었다. 뉴스 검색을 하는 일반 이용자를 기준으로 생각하더라도, 이런 조정이 불합리한 것 같지는 않다.
그보다 더 중요한 건 ‘알고리즘’을 바라보는 관점이다. 알고리즘은 인공지능(AI) 시대의 기본 문법이나 마찬가지다. 한 두 개 사안 가지고 판단할 문제가 아니란 의미다.
사실 ‘알고리즘 규제’는 우리만 논란을 벌이는 문제는 아니다. 미국, 유럽연합(EU)을 비롯한 전 세계 주요 국가들은 알고리즘 투명성 문제를 놓고 열띤 공방을 벌이고 있다. 최근 ‘사람보다 더 똑똑한’ 챗GPT가 등장하면서 이 문제는 더 시급한 과제가 됐다.
이런 상황에서 ‘특정 기간의 뉴스 노출 빈도와 순위 변화’를 정치 쟁점화하는 것은 인공지능(AI) 시대를 대비하는 바람직한 자세는 아닌 것 같다는 생각이 들었다.
이런 공방을 지켜보면서 어쩔 수 없이 EU와 미국의 최근 행보를 떠올리게 됐다.
■ 느리지만 차분하게 접근하는 미국과 EU
EU는 지난 4월 알고리즘투명성센터(ECTA)를 발족했다. 이 단체는 인공지능(AI)을 활용한 추천 시스템 같은 것들이 인종, 젠더 편견을 드러내지 않는지 감시하고 평가하는 역할을 한다. ECTA는 연내 40명 가량의 전문인력을 충원한 뒤 내년부터 본격 활동에 들어갈 계획이다.
EU가 ECTA를 만든 건 내년 본격 발효될 디지털서비스법(DSA) 때문이다. DSA는 온라인 플랫폼을 통해 허위정보나 혐오발언들이 확대 재생산되는 것을 막는 데 초점을 맞추고 있다. 그러다보니 이 법은 페이스북, 구글 같은 거대 사업자들에게 추천 알고리즘을 투명하게 공개하도록 규정하고 있다. ECTA는 바로 그 작업을 감시하는 역할을 한다.
출범 당시 ECTA는 크게 네 가지 작업에 초점을 맞출 계획이라고 밝혔다.
첫째. 검색 결과에 인종적 편견이 작용하지는 않는가.
둘째. 미성년자들에게 중요한 음성 지원 기술 어떻게 설계되는가.
셋째. 소셜 미디어 추천 시스템은 어떻게 작동하는가.
넷째. 얼굴 인식 알고리즘 문제
EU는 “디지털 서비스를 규제하기 위해선 알고리즘 작동 방식에 대해 알아야만 한다”는 문제의식에 따라 ECTA를 만들었다고 밝히고 있다.
그런데 알고리즘은 단순한 주제가 아니다. 기술 자체가 복잡할 뿐 아니라, 사회적 파장도 굉장히 폭 넓다. 그런 만큼 ECTA는 다양한 분야 전문 인력들을 충원할 계획이다. 컴퓨터, 데이터 과학자 뿐 아니라 사회과학, 인지과학 분야 전문 연구자들도 함께 연구에 참여한다. ‘다학제적 접근(multi-disciplinary approach)’을 통해 AI의 ‘블랙박스’를 열겠다는 야심인 셈이다.
인공지능이나 알고리즘에 대해 직접 규제하는 EU와 달리 미국은 관련 법은 아직 없다. 알고리즘 규제는 각 주 정부에 맡기고 있는 분산적인 체제를 가동하고 있다. 의원들이 몇 차례 알고리즘 관련 법안을 발의했지만, 성공적으로 제정된 법은 없다.
알고리즘과 관련해선 연방거래위원회(FTC)가 2020년 내놓은 ‘인공지능과 알고리즘 사용지침(Using artificial intelligence and algorithm)’이 대표적이다. FTC의 지침은 크게 5가지 원칙으로 구성돼 있다.
- 투명성: 민감한 데이터 수집 때 투명하게 공개하고 소비자를 기만하지 말 것.
- 설명가능성: 결정에 대한 구체적인 이유 설명하고 영향을 미친 요인 공개.
- 공정성: 인종, 종교, 국적, 성별에 따른 차별 금지. 공정한 결과 보장.
- 견고성 및 실증적 타당성: 정보의 정확성과 최신성을 유지할 것. 이와 관련한 명문화된 정책과 절차 마련.
의회 차원의 입법 활동 중 가장 주목할 만한 것은 2022년 발의된 ‘알고리즘 책임법(Algorithmic Accountability Act)’이다. 2019년 처음 발의됐다가 유야무야 된 것을 3년 만에 재발의한 이 법은 알고리즘 오류와 편향성 같은 문제를 규제하는 데 초점을 맞추고 있다.
■ 혁신과 규제 간의 절묘한 조화를 기대한다
이처럼 미국과 EU는 알고리즘을 총체적인 관점으로 접근한다. 사회의 기본 가치를 훼손하지 않는 것을 최우선 가치로 삼고 있다. 신기술 혁신과 사회적 혼란 사이에서 균형을 잡기 위해 노력하는 모습도 눈에 띈다.
반면 우리는 알고리즘을 비롯한 신기술 문제 조차 정치적인 공방의 대상으로 삼고 있다. 뉴스 노출 빈도와 순위를 놓고 계속 힘겨루기를 하고 있다. 이 문제에 관한한, 보수와 진보가 큰 차이를 보이는 것 같지는 않다.
나는 네이버 뉴스의 품질이 10년 전에 비해 크게 떨어졌다고 생각하는 편이다. 뉴스 공급하는 언론사는 10년 전과 크게 다르지 않은 데 네이버 뉴스의 품질은 왜 떨어졌을까?
여러 이유가 있겠지만, 정치권의 과도한 간섭도 큰 역할을 했다고 생각한다. 그 결과 ‘서비스적 관점’보다는 ‘정쟁을 피하려는 관점’이 과도하게 작용했기 때문이다.
AI 시대의 알고리즘 문제는 하루 아침에 정리할 수 있는 주제가 아니다. 미국과 EU가 조금은 답답할 정도로 느리게 ‘알고리즘 규제’를 다루는 건 그 때문이다.
특히 EU는 세계 최초로 ‘AI법’을 제정하면서 혁신과 규제 간의 균형을 맞추기 위해 많은 노력을 하고 있다. AI가 인간의 행동을 조정하거나, 특정 집단의 약점을 이용하는 등의 ‘용납할 수 없는 위험(unacceptable risk)’에 대해선 과감한 규제를 가하지만, ‘사소한 위험(minimal risk)’으로 간주할 수 있는 대부분의 AI 기술에 대해선 혁신을 우대하는 쪽에 무게를 두고 있다.
뉴스 알고리즘 문제 역시 이런 관점에서 접근했으면 좋겠다. 여야가 서로 ‘유불리’만 따지면서 정치적 공방을 벌이게 되면, 21세기 우리 삶의 많은 부분에 영향을 미칠 알고리즘 문제를 제대로 해결할 방법이 없기 때문이다.
[덧글]
편향성 문제를 다룰 때 늘 거론되는 심리 성향으로 ‘동기화된 추론(motivated reasoning)’이란 것이 있다. 정보를 처리할 때 어떤 목적이나 목표에 부합하는 결론에 맞추는 무의식적인 경향을 의미하는 말이다.
이를테면 이런 방식이다. 라이벌 팀과의 운동 경기 때는 흔히 편파 판정의 희생양이 됐다고 생각하기 쉽다. 물론 실제로 편파 판정이 있었을 수도 있다. 하지만 대부분은 자기가 응원하는 팀에 내려진 불리한 판정 한 두 개에 강한 인상을 받아서 전체적인 판결이 불리했다고 결론 내리는 경향이 있다고 한다.
특정 기간의 노출 건수만으로 알고리즘을 바라볼 경우엔 그런 결론에 도달할 가능성이 적지 않다. 실제로 나도 네이버에서 뉴스 검색을 할 때면, “지디넷 기사가 왜 저 매체보다 순위가 낮지”란 불만을 심심찮게 갖는다. (반면 노출 순위가 높았던 경우는, 쉽게 잘 잊는다.)
김익현 미디어연구소장(sini@zdnet.co.kr)
Copyright © 지디넷코리아. 무단전재 및 재배포 금지.