"다크웹 범죄 잡는다"…K스타트업·카이스트, 전용 AI모델 개발

고석용 기자 2023. 9. 12. 17:30
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

다크버트가 다루는 다크웹은 특정한 경로로만 접근할 수 있는 웹사이트들로 최근 마약밀매나 성착취, 랜섬웨어 배포 등 범죄에 활용되고 있다.

각종 불법 거래와 유해 콘텐츠가 유통되지만, 정보의 휘발성과 탈중앙화, 익명화 기술로 범죄자 추적 등이 어려운 것으로 전해진다.

이를 통해 다크웹 페이지의 내용을 포르노, 해킹, 폭력 등 주제로 분류하고 범죄 필터링, 범죄자 추적, 출처파악, 데이터 확보 등을 지원한다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

/삽화=임종철 디자이너

사이버보안 스타트업 에스투더블유(S2W)와 카이스트 연구진이 공동 개발한 다크웹 전용 AI 언어모델 '다크버트(DarkBERT)'가 논문으로 채택된 이후 해외 SNS(소셜미디어)에서 주목받고 있다. X(구 트위터)에서는 다크버트에 대한 콘텐츠 누적 조회수가 180만건을 넘어섰고, 유튜브에서도 관련 영상이 100여건 이상 제작됐다.

다크버트가 다루는 다크웹은 특정한 경로로만 접근할 수 있는 웹사이트들로 최근 마약밀매나 성착취, 랜섬웨어 배포 등 범죄에 활용되고 있다. 각종 불법 거래와 유해 콘텐츠가 유통되지만, 정보의 휘발성과 탈중앙화, 익명화 기술로 범죄자 추적 등이 어려운 것으로 전해진다.

인터폴 파트너사이기도 한 스타트업 S2W는 수집한 다크웹 데이터를 사용해 전용 AI(인공지능) 언어모델을 개발했다. 일반적인 AI 언어모델들이 다크웹의 은어나 폐쇄성 때문에 해석에 어려움을 겪는데, 다크버트는 이를 해결한 것이 특징이다. 이를 통해 다크웹 페이지의 내용을 포르노, 해킹, 폭력 등 주제로 분류하고 범죄 필터링, 범죄자 추적, 출처파악, 데이터 확보 등을 지원한다.

현재 다크버트는 일반 대중에게는 공개되지 않은 상태다. S2W는 연구 및 개발 목적으로 사용을 요청하는 곳에 한해서만 선별해 접근할 수 있도록 허용하고 있다.

그러나 다크버트는 논문 채택 이후 SNS에서 화제가 되기 시작했다. 다크버트를 개발한 S2W는 올해 6월 글로벌 자연어처리(NLP) 학술대회인 'ACL'에서 '다크버트: 인터넷의 어두운 단면을 위한 언어 모델(DarkBERT: A Language Model for the Dark Side of the Internet)'을 주제로 논문을 발표했다.

논문 발표 이후 미국의 테크미디어 탐스하드웨어 등에서 다크버트를 심층 분석했고 사이버 보안 분야 전문매체인 헬프넷시큐리티, 테네블, 사이버인트 등도 다크버트에 대해 상세히 분석했다. 또 AI 권위자인 랜스 엘리엇 박사, 필 베네이블스 구글클라우드 CISO(최고정보보안책임자) 등이 SNS를 통해 다크버트를 언급하기도 했다.

S2W 측은 "관련분야 유명인사들이 언급하기 싲가하면서 다크버트에 대한 X 콘텐츠 누적 조회수는 현재까지 180만건이 넘었으며 유튜브에도 다크버트를 소개하는 콘텐츠가 100건 이상 쏟아졌다"며 "S2W 홈페이지를 통해서는 30개국에서 50건 이상의 데모 요청과 문의가 들어왔다"고 말했다.

[머니투데이 스타트업 미디어 플랫폼 유니콘팩토리]

고석용 기자 gohsyng@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?