S2W, 사이버보안 문서 특화 AI 언어모델 '사이버튠' 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
S2W는 세계 3대 인공지능 학회로 꼽히는 'NAACL(북미 전산언어학학회)'에서 사이버보안 문서에 특화된 AI 언어모델 '사이버튠'을 공개했다고 20일 밝혔다.
S2W와 카이스트(KAIST) 연구진이 공동 개발한 사이버튠은 사이버보안 데이터 특성을 고려해 버트 등의 인코더 모델을 효과적으로 미세조정한 AI 언어모델이라는 의미를 담고 있다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
S2W는 세계 3대 인공지능 학회로 꼽히는 ‘NAACL(북미 전산언어학학회)’에서 사이버보안 문서에 특화된 AI 언어모델 ‘사이버튠’을 공개했다고 20일 밝혔다.
S2W는 이달 16~21일 멕시코시티에서 열리는 NAACL 2024에 참석해 ‘사이버보안 영역에서의 사전 학습을 위한 비언어적 요소 활용(Ignore Me But Don't Replace Me: Utilizing Non-Linguistic Elements for Pretraining on the Cybersecurity Domain)’ 논문을 발표했다. 이로써 S2W는 자연어처리(NLP) 분야 세계 최정상급 학회에서 3년 연속 논문이 채택되는 성과를 달성했다.
S2W와 카이스트(KAIST) 연구진이 공동 개발한 사이버튠은 사이버보안 데이터 특성을 고려해 버트 등의 인코더 모델을 효과적으로 미세조정한 AI 언어모델이라는 의미를 담고 있다. 지난해 전 세계 최초로 선보인 다크웹 전용 AI 언어모델 ‘다크버트’에 이어 두 번째로 공개하는 S2W만의 언어모델이다.
사이버튠의 기본 틀이 되는 ‘버트'란 언어모델에 더욱 고차원 단계인 문맥을 이해할 수 있도록 MLM(Masked Language Modeling)을 거쳐 작업 수행 능력을 향상시키는 양방향 언어 인코더 모델이다. 버트가 일반적인 문자열 외에도 URL, SHA Hash처럼 사람이 쉽게 해석하기 어려운 비언어적 요소가 담긴 사이버보안 문서들을 잘 이해하도록 돕는 것이 사이버튠 기술의 핵심이다.
업계 전문가들에 따르면 기존에도 보안 문서 대상으로 AI 언어모델을 학습한 시도는 있었으나 일반적으로 사용되는 언어와 전문적인 사이버보안 지식에 사용되는 언어가 달라 맥락을 제대로 이해하는 데 한계가 있었다.
S2W는 이를 개선하기 위해 자체적으로 비정형 데이터를 가공하고 독보적인 모니터링 기술로 보안 문서 데이터를 수집했다. 비언어적 요소들에 대해서는 문장 구성 요소 대신 유형을 학습하도록 방식을 변경했으며 이를 통해 사이버보안 관련 문서 분류, 개체명 인식, 사건 탐지 등 다양한 작업에서 유의미한 결과를 얻을 수 있었다.
사이버튠은 오픈소스로 공개돼 앞으로 AI를 이용해 사이버보안 문서를 분석하고 이를 통해 새로운 위협 발굴 및 효과적 대응을 고민하는 조직과 전문가에게 도움을 줄 것으로 기대된다. 또한 S2W의 자비스, 퀘이사 등 자사 서비스에도 적용하는 등 다양한 AI 관련 모듈에 확대 적용할 예정이다.
구체적으로 사이버튠을 통해 웹상의 수많은 사이버보안 문서들을 실시간으로 인코딩하여 벡터DB에 저장한다. 사용자 질문이 주어지면 검색증강생성(RAG) 방식으로 질문에 답이 될 수 있는 문서들을 빠르게 검색 후 거대언어모델(LLM)을 통해 답변을 생성, 사용자에게 제공하는 식의 검색 기반 챗봇 서비스를 공개할 계획이다.
S2W 서상덕 대표는 “사이버튠은 보안 위협을 발견하는 것을 넘어 실질적인 해결 솔루션까지 제시할 수 있는 강력한 보안 기술로 S2W가 글로벌 데이터 인텔리전스 기업으로 고속 성장하는 핵심 동력이 될 것”이라며 “앞으로도 보안 특화 AI 언어모델 분야에서 독보적 기술 경쟁력을 유지해 나갈 것”이라고 말했다.
solidkjy@fnnews.com 구자윤 기자
Copyright © 파이낸셜뉴스. 무단전재 및 재배포 금지.
- 남편상 사강, 4년만 안방 복귀…고현정 동생
- 최현욱, 장난감 자랑하다 전라노출…사진 빛삭
- "치마 야하다고"…엄지인, 얼마나 짧기에 MC 짤렸나
- "눈 떴는데 침대에 피가 흥건"..토니안, 정신과 증상 8가지 나타났다 고백 [헬스톡]
- '김가네' 김용만 회장, 여직원 성폭행 시도 혐의로 입건
- 영주서 50대 경찰관 야산서 숨진채 발견…경찰 수사 착수
- "조카 소설, 타락의 극치" 한강의 목사 삼촌, 공개 편지
- "엄마하고 삼촌이랑 같이 침대에서 잤어" 위장이혼 요구한 아내, 알고보니...
- "딸이 너무 예뻐서 의심"…아내 불륜 확신한 남편
- "절친 부부 집들이 초대했다가…'성추행·불법촬영' 당했습니다"