검색결과가 이상해보여 네이버에 공문 보냈더니… 결과가 바뀌었다

최승영 기자 입력 2023. 11. 28. 23:08 수정 2023. 11. 29. 15:40
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[책과 언론] 논문 '공문을 보내면 네이버는 검색 알고리즘을 바꾸는가?'

한국언론학회의 지난달 14일 정기총회에서 우수논문상을 수상한 <공문을 보내면 네이버는 검색 알고리즘을 바꾸는가?>는 제목만큼이나 도발적인 논문이다. 윤호영 이화여대 커뮤니케이션·미디어학부 교수, 진보래 중부대 미디어커뮤니케이션학과 교수가 참여한 연구는 제목 그대로 ‘한 시민단체의 문제 제기 후 네이버의 이미지 검색결과가 소리소문없이 달라진 변화’를 확인했다. 의미 있는 포털·언론 관련 연구는 많지만 고발성 언론보도의 정체성을 상당히 지닌다는 점에서 드문 사례다. 여러 추가 의문과 큰 파장을 야기할 수 있는 어떤 실태가 너무나 간단명료하게 확인됐다는 점에서 당황스러운 지점도 있다.

지난달 14일 한국언론학회 정기총회에서 우수논문상을 수상한 <공문을 보내면 네이버는 검색 알고리즘을 바꾸는가?> 논문 첫 장 캡처(왼쪽)와 네이버 이미지 검색결과가 시민 단체의 문제제기를 전후해 달라진 모습. 예컨대 '길거리'란 단어의 검색결과는 당초 '여성'의 모습을 다수 노출했지만 이후 '건물 및 도로' 사진이 등장하도록 조치됐다.

연구는 특정 시점을 전후해 몇몇 검색어의 네이버 이미지 검색결과가 달라졌다는 점을 골자로 한다. 포털 사이트에서 일상적인 단어를 검색해도 “성적이고, 성편향적이며, 성차별적인 이미지”가 노출되는 부분에 시민단체 ‘정치하는엄마들’은 2022년 6월 문제 제기 및 캠페인 전개, 그해 9월 네이버에 몇몇 검색어 및 이미지 삭제요청 공문발송 등을 했는데, 이를 기점으로 어떤 반응이나 설명 없이 이미지 검색결과가 달라진 사실을 데이터로 확인한 게 바탕이 됐다. 2021년부터 이 현상을 주시하며 관련 데이터를 스크린샷 저장, 스크래핑 해온 터 동일한 검색어 비교가 가능했고, 이에 따라 ‘꼭지’, ‘꽐라’, ‘길거리’, ‘다리’, ‘도끼’, ‘돌핀팬츠’, ‘디스코팡팡’ 등 26개 단어를 분석대상으로 삼았다.

조사결과 전체 단어 중 8개에서 공문발송 전후 확연히 구분된 결과가 발견됐다. 예컨대 ‘길거리’의 경우 2021년 10월 수집 당시엔 ‘몸매가 드러나는 옷을 입은 여성 모습’ 등을 검색결과로 다수 노출했는데, 시민단체 캠페인 이후인 2022년 9월엔 ‘양쪽에 건물이 늘어서 있고 가운데 도로가 소실점을 향해 뻗어 있는 구도의 이미지’가 나타났다. 이 이미지들의 출처를 찾아본 결과 제목 태그에서 ‘사진’이란 단어가 공통적으로 확인됐다. 다시 말해 ‘길거리’를 검색하면 자동으로 ‘길거리 사진’이란 검색결과가 나오게 변경된 것이었다. 이처럼 ‘레이싱’이 ‘레이싱 경기’로, ‘모델’이 ‘패션 모델’로 바뀐 결괏값을 노출하며 ‘복합어 검색 결과로 대체’된 패턴이 확인됐다.

이 외 ‘유사어 검색결과로 대체’하는 방식도 확인됐다. ‘사진집’을 검색하면 ‘앨범’ 검색과 동일한 결과를 내게 하고, ‘아찔’의 경우 ‘아찔한 곳’이란 검색어로 대체되는 식이었다. ‘자동완성기능이 생성하는 목록 1순위 검색어로 대체’한 사례도 있었는데 이에 따라 ‘호불호’는 ‘호불호가 갈리는 음식’, ‘레전드’는 ‘레전드 뜻’, ‘피지컬’은 ‘피지컬 뜻’의 이미지 검색결과를 보여줬다. 연구진은 이 같은 유형화에 대해 “네이버가 검색 알고리즘을 개정하거나 개선했다기보다는 개별 검색어마다 보기 불편한 이미지들을 적당히 가리기만 한 것”으로 평가하며 특정 결과가 나오게 몇몇 단어만 조정한 행태를 ‘인위적 조작과 본질적으로 다르지 않다’, ‘원래부터 나온 결과처럼 위장한 효과도 있다’고 지적했다.

특히 연구가 문제 삼은 지점은 자의적으로 아무 설명 없이 알고리즘 변경이 이뤄진 부분이었다. 연구진은 “자료 수집이 있지 않았다면 전혀 알지 못한 채 지나갔을 일”이라며 애초 시민단체의 캠페인과 언론보도가 없었다면 알고리즘이 수정됐을지, 누군가 문제 제기하면 알고리즘은 언제든 변경되는지, 그렇다면 뉴스 서비스는 그렇지 않다는 보장이 있는지 등 따르는 의문을 연달아 제기했다. 이를 통해 알고리즘 자체에 편향이 내재했는지 같은 기술적인 설명 투명성만으론 불충분하고, 알고리즘이 내는 결과와 변화를 끊임없이 설명하는 플랫폼의 책무를 강조하는 전개다.

논문에서 지적된 네이버의 이런 태도는 플랫폼을 넘어선 차원의 논의 필요성으로 이어진다. 연구진은 ‘전체 알고리즘 수정이 필요하다’거나 ‘조치 수행 과정 중 우선적인 임시 조치’, ‘개선에 시간 소요’ 등 플랫폼의 입장을 예상하며 이 연구가 기술이 아니라 운용상의 태도, 공론화 경로 마련 같은 알고리즘 책무성 실천을 위한 근원적 차원임을 분명히 한다. 이는 “알고리즘의 개선과 관련된 기술적 문제는 실제 투여하는 자원의 크기와 관련이 있다기보다는 사실상 사회적 압력의 크기와 비례한다”는 인식과 맞물리며 개별 플랫폼에서 나아가 사회 전반의 과제가 되는 부분이다.

포털의 기본 기능 중 하나인 이미지 검색결과에서 이 연구는 시작됐다. 최근 흐름에서 이 기술 자체는 원시적인 수준에 불과하겠지만 우리 공동체에 시사점은 분명하다. 국민 일반에 영향을 미칠 기술이, 플랫폼 기업이 사회에 책임을 지는 바른 방식이 무엇인지, 공동체로부터 어떤 압력과 견제를 받아야 하는지 합의가 아직 완성되지 못했다는 게 핵심이다. 생성형 AI에 따른 변혁이 예고되는 현재, 고유하지만 낯설지 않은 주제의 연구가 못 다한 과제를 우리에게 던진다.

이하 요청에 따라 29일 오후 3시께 네이버 입장 추가반영함.

검색결과는 사용자의 선호도, 검색어와의 연관성 등을 종합적으로 판단하여 측정한 값을 기반으로 자동으로 노출 및 제어되는 구조로, 수많은 검색어와 방대한 출처 콘텐츠로 결과 예측이 현실적으로 어려움이 있음.

다만, 네이버는 서비스 전반에 걸친 상시모니터링과 24시간 신고센터를 통한 신속한 대응을 통해 음란/불법/청소년유해등의 게시물의 확산 및 2차피해를 예방하고 있으며, AI 필터링 기술 'x-eye' 적용 등을 통한 적극적 노력을 기울이고 있음.

그럼에도 불구하고 사회적으로 우려가 되거나, 선정성이 높은 이미지 검색결과가 일부 노출되고 있는 부분에 대해서는 모니터링를 강화하고, 부적절 이미지 노출에 대한 신고 및 대응 프로세스 최적화를 비롯하여, 중장기적 관점에서도 서비스 개선과 정책적 조치들을 도입하는 방향으로 대응해 갈 것

Copyright© 기자협회보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?