"악플·혐오표현 막는다"..스마일게이트AI센터 데이터셋 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
스마일게이트AI센터는 악플 및 혐오 발언 데이터셋을 공개한다고 20일 밝혔다.
센터는 스타트업 언더스코어와 함께 지난 2019년 1월 1일부터 2021년 7월 1일까지 포털, 커뮤니티 등 다양한 웹사이트 게시글을 대상으로 악플 및 혐오 발언 데이터를 수집했다.
센터는 이번 데이터셋으로 게임 커뮤니티 댓글이나 고객 응대 상담 챗봇, 여론조사 등 여러 분야에서 혐오발언 여부를 파악할 수 있을 것으로 기대했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
스마일게이트AI센터는 악플 및 혐오 발언 데이터셋을 공개한다고 20일 밝혔다. 최근 온라인상에서 급증하는 혐오표현을 선제적으로 감지하고 대응하기 위해서다.
센터는 스타트업 언더스코어와 함께 지난 2019년 1월 1일부터 2021년 7월 1일까지 포털, 커뮤니티 등 다양한 웹사이트 게시글을 대상으로 악플 및 혐오 발언 데이터를 수집했다. 약 55만여개의 데이터를 기반으로 1만개의 데이터셋을 구축했다.
센터는 데이터셋을 △여성/가족 △성소수자 △남성 △인종/국적 △연령 △지역 △종교 △기타혐오△ 등 8개 대상으로 범주화했다. 혐오 발언 분류를 위한 기준 모델도 공개했다. 이번에 수집된 데이터는 1월 중 센터 깃허브 페이지에서 공개될 예정이다.
센터는 이번 데이터셋으로 게임 커뮤니티 댓글이나 고객 응대 상담 챗봇, 여론조사 등 여러 분야에서 혐오발언 여부를 파악할 수 있을 것으로 기대했다. 지속적인 R&D(연구·개발)로 혐오 표현을 정확하게 찾아낼 수 있는 기술을 고도화한다는 방침이다.
한우진 스마일게이트AI 센터장은 "이번에 공개된 데이터가 인공지능을 안전하게 활용하는 밑거름이 되기를 바란다"며 "그동안 진행해온 연구 결과와 노력들이 기술적인 관점뿐만 아니라 사회에 긍정적인 기여를 할 수 있도록 다양한 노력을 시도할 것"이라고 말했다.
<저작권자 ⓒ '돈이 보이는 리얼타임 뉴스' 머니투데이, 무단전재 및 재배포 금지>
Copyright © 머니투데이 & mt.co.kr, 무단 전재 및 재배포 금지
- "송지아, 디올 광고에 디올 짝퉁 들고 나왔을 줄이야"…영상 삭제 - 머니투데이
- "효도하라" 며느리 8년 성폭행 시부…유방암 입원 중에도 '경악' - 머니투데이
- "키아누 리브스, 3700억 재산 너무많아 당황..상당수 기부"
- '상간녀 소송 취하' 황보미…"오해 풀었다" 전한 뒤 올린 근황 - 머니투데이
- '태종 이방원', 말 학대 사실로…발목 묶어 강제로 넘어뜨려[영상] - 머니투데이
- 'ADHD 의심' 김희철 "음주할까 봐 차도 팔아…사고 바란 적도" - 머니투데이
- "중소기업 대표, 회식 중 성추행"… 출근 두려운 새내기 여직원 - 머니투데이
- "저 아니에요" 허경환 이어 슬리피도…김호중 술자리 루머 '부인' - 머니투데이
- [단독] 19조 '리튬 노다지' 찾았다…한국, 카자흐 채굴 우선권 유력 - 머니투데이
- 바람 피운 재력가 남편의 반성…"부동산이랑 현금 넘길게" - 머니투데이