스마일게이트 AI센터, 악플·혐오발언 데이터셋 공개..커뮤니티, 챗봇 등 활용
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
스마일게이트 AI센터(센터장 한우진)이 악플 및 혐오 발언 데이터셋을 공개한다고 20일 발표했다.
스마일게이트 AI 센터는 최근 혐오 표현이 온라인 공간에서 광범위하게 증가하고 있고, 사회적 문제로 이어질 수 있다는 점을 고려해 혐오 표현을 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다.
스마일게이트 AI 센터의 악플 및 혐오 발언 데이터셋은 향후 다양한 영역에서 활용될 수 있을 것으로 기대된다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
[아이뉴스24 박예진 기자] 스마일게이트 AI센터(센터장 한우진)이 악플 및 혐오 발언 데이터셋을 공개한다고 20일 발표했다.
스마일게이트 AI 센터는 최근 혐오 표현이 온라인 공간에서 광범위하게 증가하고 있고, 사회적 문제로 이어질 수 있다는 점을 고려해 혐오 표현을 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다. 이번 프로젝트는 지식 콘텐츠 스타트업 언더스코어와 협업을 통해 이뤄졌다.
악플 및 혐오 발언 데이터는 지난 2019년 1월 1일부터 2021년 7월 1일까지 기간 동안 포털 사이트, 커뮤니티 등 다양한 웹사이트의 게시글을 대상으로 수집했다. 수집 과정에서 혐오 관련 데이터의 시의성과 편향성을 띄고 있는 특성을 감안했으며, 약 55만 여 개의 데이터를 기반으로 1만 개의 데이터셋을 구축했다.
특히 데이터셋 구축 과정에서 '여성/가족' '성소수자' '남성' '인종/국적' '연령' '지역' '종교' '기타혐오' 등 8개의 대상으로 범주화했다. 혐오 발언 분류를 위한 기준 모델 공개를 통해 혐오 발언 추출이 가능하다는 설명이다.
스마일게이트 AI 센터의 악플 및 혐오 발언 데이터셋은 향후 다양한 영역에서 활용될 수 있을 것으로 기대된다. 게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇, 여론 조사 등 여러 분야에서 대상을 둘러싼 혐오 발언 여부를 파악할 수 있다. 향후 지속적인 연구개발을 실시하면서 확보 된 기술력을 바탕으로 혐오 표현을 보다 높은 정확도로 정확하게 찾아낼 수 있는 기술을 고도화 할 계획이다.
한편 이번에 수집된 데이터는 스마일게이트 AI 센터 깃허브 페이지를 통해 1월 중 공개될 예정이다.
한우진 스마일게이트 AI 센터장은 "AI 센터는 자연어 처리 및 분류 관련 연구 목적 외에도 윤리성이 결여된 인공지능이 사회에 미치는 문제에 대해서 연구하고 있는 기관으로서 책임과 문제의식을 갖고 있다"면서 "특히 이번에 공개된 데이터가 좀 더 안전하게 인공지능을 활용하는 데 밑거름이 되기를 바란다"고 말했다.
이어 "향후 스마일게이트 AI 센터는 그동안 진행해온 연구 결과와 노력들이 기술적인 관점에서 뿐만 아니라 사회에 긍정적인 기여를 할 수 있도록 다양한 노력을 시도할 것"이라고 말했다.
/박예진 기자(true.art@inews24.com)▶네이버 채널에서 '아이뉴스24'를 구독해주세요.
▶재밌는 아이뉴스TV 영상보기▶아이뉴스24 바로가기
[ⓒ 아이뉴스24 무단전재 및 재배포 금지]
Copyright © 아이뉴스24. 무단전재 및 재배포 금지.
- 빅픽처, 스마일게이트로부터 'WCG' 인수
- 스마일게이트, 버추얼 아티스트 '한유아', 첫 화보 공개
- [주말엔 건강] 맨발 걷기, 장소와 방법 잘 따라야 건강에 도움
- [Hong시승기] 아이오닉6, 미래지향적 디자인에 우수한 성능까지
- "멋진 오빠가 아니라 50대 아저씨"…동안男이 공개한 '비법'
- 현대로템, 우즈벡에 K-고속철 사상 첫 수출…2700억원 규모
- '해저케이블' 기술 유출 의혹에…LS전선 "위법 확인시 법적 조치"
- 주총 앞둔 라인야후…'라인의 아버지' 신중호 물러나고 새 이사회 구성
- 손해보험사, 소액보험으로 제3보험 시장 공략
- [겜별사] 전사로 변신한 쿠키들…'쿠키런: 모험의 탑' 어떻게 차별화했나