유튜브 영상 560만개 '머신러닝'이 삭제...이유는?

작년 4·4분기 커뮤니티 가이드 위반 560만개 영상 삭제
삭제된 영상 94% 이상이 '머신러닝'에 의해 자동 감지
가짜뉴스 문제 계속돼‥"4R 통해 건강한 생태계 조성"

유튜브는 지난해 10~12월 전 세계에서 커뮤니티 가이드를 위반하는 560만 개 이상의 영상을 삭제한 것으로 나타났다. 사진은 유튜브 쇼츠 로고. 유튜브 제공

[파이낸셜뉴스] 동영상 플랫폼 유튜브가 커뮤니티 가이드를 위반하는 영상을 머신러닝(기계학습)을 통한 자동 감지로 꾸준히 삭제하고 있다. 실제 대다수의 부적절한 영상은 널리 퍼지기 전에 감지돼 삭제된 것으로 나타났다.

작년 10~12월 세계 560만개 영상 삭제

19일 유튜브 커뮤니티 가이드 시정 조치 보고서에 따르면 지난해 10~12월 유튜브는 전 세계에서 커뮤니티 가이드를 위반하는 560만 개 이상의 영상을 삭제한 것으로 나타났다. 음란물, 폭력 조장, 괴롭힘, 증오심 표현 등이 담긴 콘텐츠 확산을 막기 위해서다. 한국만 보면, 지난해 4·4분기 커뮤니티 가이드를 위반한 4만개 이상의 영상이 삭제됐다.

전 세계 기준 삭제된 영상 94% 이상이 머신러닝에 의해 자동 감지됐다. 머신러닝에 의해 자동 감지된 영상 중 38%는 조회수가 전혀 발생하지 않은 상태에서 삭제됐고, 33%는 조회수가 10회 이하였다.

유튜브는 △90일 내에 커뮤니티 가이드 위반 경고가 3회 누적되거나 △심각한 악용 사례(약탈적 행동 등)가 1회 적발되거나 △가이드를 위반하는 데 전적인 의도가 있다고 판단되는 경우 채널을 폐쇄한다. 이로 인해 지난해 4·4분기 전 세계에서 640만개 이상의 채널이 삭제된 것으로 집계됐다. 대다수가 스팸, 기만 행위 및 사기 관련 정책을 위반한 것으로 나타났다.

유튜브 관계자는 "크리에이터(창작자) 및 콘텐츠 시청자들이 유튜브를 안전하게 이용할 수 있도록 기술 및 시스템에 꾸준히 투자하고 있다"고 설명했다. 이어 "머신러닝과 콘텐츠 검토를 담당하는 인력과 함께 커뮤니티 가이드를 위반하는 콘텐츠를 빠르게 삭제하고 있다"며 "유튜브 정책은 어떠한 관점을 가졌는지, 말하는 사람이 누구인지 관계 없이 일괄적으로 적용된다"고 덧붙였다.

분당 500시간 업로드...가짜뉴스 여전

이 같은 조치에도 불구하고 유튜브발(發) 가짜뉴스 문제는 계속되고 있다.

유명인의 '사망설'이나 '이혼설', '임신설' 등 자극적인 키워드로 조회수를 높이는 경우가 대표적이다. 향후 생성 인공지능(AI)이 활발하게 이용되면서 영상 콘텐츠 속 진실과 거짓을 구별하기는 점차 어려워질 전망이다.

하지만 모든 콘텐츠를 규제하기엔 현실적인 제약이 크다. 매분마다 유튜브에 업로드되는 콘텐츠 분량은 500시간에 이르는 것으로 알려졌다. 양이 막대할 뿐만 아니라 커뮤니티 정책을 위반하지 않지만, 문제의 소지가 있는 콘텐츠는 항상 존재할 수밖에 없다. 과도한 커뮤니티 규제는 표현의 자유 침해로 이어질 수 있다는 우려도 꾸준하다.

이에 유튜브는 잘못된 정보가 확산되는 것을 방지하기 위해 지속적으로 새로운 데이터를 시스템에 학습시키고 있다.

세분화된 분류 기준, 다양한 언어로 된 키워드, 현지 애널리스트의 정보를 활용해 기본 분류 기준이 포착하지 못하는 정보를 식별할 수 있도록 한다는 설명이다. 아울러 커뮤니티 가이드를 위반하는 영상을 빠르게 삭제할 뿐만 아니라 신뢰할 수 있는 정보를 우선 노출하고 있다. 예컨대 의학 정보에 관해서도 검색 결과 보건복지부 등 공신력이 있는 출처 콘텐츠가 먼저 뜨도록 하고 있다.
#유튜브 #머신러닝 #가짜뉴스

IT/과학

유튜브 영상 560만개 '머신러닝'이 삭제...이유는?