스마일게이트 AI센터, AI 윤리성 연구 위한 혐오 발언 데이터 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
스마일게이트 AI(인공지능)센터는 악플 및 혐오 발언 데이터셋을 공개한다고 20일 밝혔다.
스마일게이트 AI 센터는 최근 혐오 표현이 온라인 공간에서 광범위하게 증가하고 있고, 사회적 문제로 이어질 수 있다는 점을 고려, 혐오 표현을 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다.
스마일게이트 AI센터는 이 같은 악플·혐오 발언 데이터셋이 향후 다양한 영역에서 활용될 수 있을 것으로 기대했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
55만여개 데이터 대상 1만개 데이터 선별
사회적 맥락 고려 유형 세분화
"추후 다양한 분야에 활용 가능할 것"
[파이낸셜뉴스] 스마일게이트 AI(인공지능)센터는 악플 및 혐오 발언 데이터셋을 공개한다고 20일 밝혔다. 수집된 데이터는 스마일게이트 AI 센터 깃허브 페이지를 통해 1월 중 공개될 예정이다.
악플 및 혐오 발언 데이터는 지난 2019년 1월 1일부터 2021년 7월 1일까지 기간 동안 포털 사이트, 커뮤니티 등 다양한 웹사이트 게시글을 대상으로 수집했다. 수집 과정에서 혐오 관련 데이터 시의성과 편향성을 띄고 있는 특성을 감안, 약 55만개의 데이터를 기반으로 1만개의 데이터셋을 구축했다.
데이터셋 구축 과정에서는 △'여성/가족' △'성소수자' △'남성' △'인종/국적' △'연령' △'지역' △'종교' △'기타혐오 등 8개 대상으로 범주화했다. 혐오 발언 분류를 위한 기준 모델을 공개, 이를 통해 혐오 발언 추출이 가능하다.
스마일게이트 AI센터는 이 같은 악플·혐오 발언 데이터셋이 향후 다양한 영역에서 활용될 수 있을 것으로 기대했다. 게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇, 여론 조사 등의 분야에서 혐오 발언 여부를 파악할 수 있다. 향후 지속적인 연구개발(R&D)를 실시하면서 확보된 기술력을 바탕으로 혐오 표현을 보다 정확하게 찾을 수 있도록 기술을 고도화할 계획이다.
스마일게이트 AI 센터 한우진 센터장은 "AI 센터는 자연어 처리 및 분류 관련 연구 목적 외에도 윤리성이 결여된 AI가 사회에 미치는 문제에 대해 연구하고 있는 기관으로서 책임과 문제의식을 갖고 있다"며 "이번에 공개된 데이터가 혐오 표현이나 AI의 윤리성이 사전에 분류 및 예방돼 좀 더 안전하게 AI를 활용하는 데 밑거름이 되기를 바란다"고 전했다. 이어 "향후 스마일게이트 AI 센터는 그동안 진행해온 연구 결과와 노력들이 기술적인 관점에서뿐 아니라 사회에 긍정적인 기여를 할 수 있도록 다양한 노력을 시도할 것"이라고 덧붙였다.
#인공지능 #AI #스마일게이트 #악플 #혐오
Copyright © 파이낸셜뉴스. 무단전재 및 재배포 금지.
- 죽은 남편 아이 임신한 상간녀, 건물주 아내에 "전재산 내놔"
- 김대호 "MBC 14년차 차장, 연봉 1억…물가 올라 부족해"
- CCTV 공개.. 김호중 운전석, 길 조수석서 내렸다
- '70억 아파트 거주' 김동현 "코인하다 길바닥 앉을 뻔"
- ‘계곡살인’ 이은해 “억울하다”…父 “난, 우리 딸 말 100% 믿어”
- "버닝썬 공갈젖꼭지 충격"…홍콩 女스타도 피해 고백
- "집 담보 대출받아서 줘"..며느리 직장까지 찾아가 돈 요구한 시아버지
- 10대 딸에 "성관계 하자"한 남성..父 주먹 한방에 숨졌다
- "임영웅, 김호중 생각하라! 그렇게 돈 벌고 싶냐!" 선 넘은 팬심 논란
- 김윤지, 만삭 임산부 맞아? 레깅스로 뽐낸 비현실적 몸매