[이슈분석/댓글로 본 이익공유제]이익공유제 댓글 어떻게 분석했나
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
이번 조사는 입법 빅데이터 분석 리서치 기업인 폴메트릭스와 공동으로 진행했다.
폴메트릭스는 정치와 국회, 입법 등 분야 각종 데이터를 빅데이터와 인공지능(AI)을 활용해 분석하고 있다.
11일부터 15일까지 총 488개 뉴스에 달린 댓글 2만6968개의 빅데이터에서 긍정과 부정을 분류했다.
부정댓글에서는 나라, 국가, 정부, 등 1000건 이상 언급된 유사 키워드를 하나로 합쳤다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
이번 조사는 입법 빅데이터 분석 리서치 기업인 폴메트릭스와 공동으로 진행했다. 폴메트릭스는 정치와 국회, 입법 등 분야 각종 데이터를 빅데이터와 인공지능(AI)을 활용해 분석하고 있다. 지난해 총선에서 연동형비례대표제 예상 의석수 계산기로 관심을 받았고 최근에는 법안 가결 예측서비스를 선보이기도 했다.
댓글은 네이버에 뉴스 콘텐츠를 서비스하는 언론사 총 47곳의 이익공유제 관련 뉴스에서 추출했다. 11일부터 15일까지 총 488개 뉴스에 달린 댓글 2만6968개의 빅데이터에서 긍정과 부정을 분류했다.
긍정과 부정 분류에는 AI 머신러닝 기법을 활용했다. 전체 댓글 중 20% 댓글을 샘플로 먼저 뽑아 '긍정'과 '부정'을 라벨링 하고, 이를 학습시켜 나머지 댓글의 긍정과 부정 의견을 나눴다.
상위 10개 연관키워드에서 일부 유사 키워드는 병합했다. 부정댓글에서는 나라, 국가, 정부, 등 1000건 이상 언급된 유사 키워드를 하나로 합쳤다. 월급 키워드에서는 연봉, 급여 등 유사키워드가 추출됐지만 1000건이상 언급되지 않아 생략했다.
상대적으로 모수가 적었던 긍정댓글은 기업, 업체 등 10건 이상 언급되는 유사 키워드를 병합했다.
조정형기자 jenie@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.
- 삼성 미니 LED TV, '프리미엄 쩐의 전략' 나왔다
- 폰 개통 사전승낙 신청…'대리점'에서만 한다
- 벤처천억기업 617곳…경제 버팀목 역할 '톡톡'
- 신세계 이마트, 프로야구 구단 SK와이번스 인수
- '포스트 코로나' 보건복지 디지털 뉴딜 가속화
- 삼성디스플레이, 폴더블 디스플레이 첫 외판…하반기 中 스마트폰 업체 공급
- 작년 日 불화수소 수입 전년보다 74.2% 급감…'소부장 자립' 계속된다
- 돌아온 '노트북 시즌'…1분기 신제품 경쟁 '후끈'
- 한전, 신재생에너지 발전 참여 논의 지지부진…전문가 “정보공개 높이고, 전력판매 시장 개방
- 티씨케이, '재생 SiC 링' 특허침해소송 제기