S2W, 보안능력 대폭 강화한 언어모델 S·AIP 공개

이상덕 기자(asiris27@mk.co.kr) 2024. 3. 13. 14:45
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

“한국판 팔란티어로 성장할 것”
비정형 정형 데이터 수집 맞춤형 sLLM
민감한 기업 데이터 유출 막아준다
AI 챗봇, 직급별로 답변 달리해 유출 최소화
데이터 인텔리전스 기업인 에스투더블유(S2W·대표 서상덕)는 13일 서울 삼성동 코엑스에 있는 스튜디오 159에서 차세대 인공지능(AI) 플랫폼인 ‘에스에이아이피(S·AIP)’ 발표 행사를 열었다. 서상덕 대표가 발표를 하고 있는 모습.
보안 능력을 대폭 강화한 소형 대규모언어모델(sLLM)이 국내 기술로 개발됐다.

데이터 인텔리전스 기업인 에스투더블유(S2W·대표 서상덕)는 13일 서울 강남구 삼성동 코엑스에 있는 스튜디오 159에서 차세대 인공지능(AI) 플랫폼인 ‘에스에이아이피(S·AIP)’ 발표 행사를 열었다.

서상덕 에스투더블유 대표는 “인공지능 학습 속도가 최근 5개월간 3배 빨라졌다”면서 “미국에서는 현재 엔비디아가 만든 칩을 활용한 마이크로소프트 AI를 갖고, 팔란티어가 만든 빅데이터 분석 플랫폼을 쓰고 있다”고 개발 배경을 설명했다. 이어 그는 “빅데이터 분석 전문 사이버 보안기업인 팔란티어는 오늘날 세계 최대 규모의 AI 솔루션 기업으로 성장했다”면서 “에스트더블유가 한국판 팔란티어로 넘어서 세계로 뻗어나가겠다“꼬 말했다.

이날 에스투더블유가 선보인 에스에이아이피(S-AIP·S2W Artificial Intelligence Platform)는 빅데이터, 증강검색, 생성, 보안 기술을 유기적으로 결합한 소규모 대형언어모델(sLLM)이다. 특히 인공지능, AI, 보안의 장점을 살렸다. 플랫폼에는 에스투더블유가 보유한 비정형·정형 민감 정보 데이터 처리 기술과 다년간 도메인 특화 AI 언어모델 구축 경험이 녹아있다.

우선 에스에이아이피는 기업내 모든 정형·비정형 데이터를 중앙화한다. PDF 파일이나, 시황, 포럼, JSON 파일등을 가리지 않는다. 이를 기반으로 사용자 질문을 이해하고 이에 대해 답변을 내놓는 AI인 것이다. 에스투더블유는 에스에이아이피를 통해 업무 효율과 생산성을 높일 수 있다고 강조했다.

특히 기업 내부에서만 활용할 수 있도록 해 보안성을 톺였다. 또 특화용 언어 모델을 구축해 환각 현상을 크게 줄이고, 데이터 유출 취약점을 최소화할 수 있도록 했다. 아울러 환각인 할루시네이션 문제를 해결하기 위해서 검색 증강 생성(RAG)·지식 그래프를 활용할 수 있도록 설계했다. 이밖에 실시간 최신 정보를 참조할 수 있도록, 외부 수집 데이터베이스를 별도로 구축·운용할 수 있도록 지원한다.

접근성도 차별화했다. 기업내 직급별 접근 권한을 설정할 수 있다. 하위 직급 직원이 회사 고급 정보를 물어, 정보를 획득하는 것을 통제할 수 있다. 이를 통해 정보 유출을 최소화할 수 있는 셈이다.

또 AI가 생성한 답변을 외부 데이터로 보강하여 대답의 정확성과 유용성을 높였다. 이를 통해 신뢰성과 시의성 문제를 해결했다는 것이 회사 측 설명이다.

데이터 인텔리전스 기업인 에스투더블유(S2W·대표 서상덕)는 13일 서울 삼성동 코엑스에 있는 스튜디오 159에서 차세대 인공지능(AI) 플랫폼인 ‘에스에이아이피(S·AIP)’ 발표 행사를 열었다. 정진우 이사가 발표를 하고 있는 모습.
에스투더블유는 다크웹 분석의 강자다. 에스트더블유는 지난해 도메인 학습 최적화를 통해 다크웹 특화 언어 모델(DarkBERT)을 구축한 바 있으며, 도메인 최적화 학습·튜닝에 대한 노하우마저 보유하고 있다.

보안에서는 웹을 크게 두 가지로 구분한다. 일반적인 브라우저인 ’표면 웹‘, 사용자 익명성을 보호하기 위한 ’딥다크웹‘이 그것이다. 문제는 딥다크웹이다. 이러한 웹을 통해 해킹, 마약 거래, 테러 등에 대한 정보가 오간다. 에스트더블유는 서로 다른 다크웹에 올린 게시물을 비교 분석해 실제 게시물을 올린 인물을 AI로 추적할 수 있는 기술을 갖고 있다.

정진우 에스투더블유 이사는 “도메인 게시물뿐 아니라 텔레그램 등을 분석해 동일 인물 가능성을 탐지할 수 있다”며 “단어 선택, 게시 시간대, 스타일까지 빅데이터로 수집해 분석할 수 있다”고 말했다. 에스투더블유는 다크웹 사용자명, 해킹 포럼 게시물, 언급된 피해기관, 텔레그램 ID, 업종, 국가, 대륙, 상위 업종 등 각종 데이터를 수집해 설계도인 온톨로지를 그려낸다. 그는 “도메인은 일종의 세계관인 온톨로지”라고 설명했다. 이렇게 그려낸 온톨로지를 토대로 다크웹 특화 언어모델을 만든 것이다.

에스투더블유는 이에 그치지 않고 온톨로지를 토대로 직관적인 지식 그래프를 그릴 수 있다. 에스피에이아이는 이런 노하우를 토대로 개발됐다.

S2W는 사이버 공간 빅데이터를 AI로 분석하는 전문 기업이다. 안보·보안·유출·해킹 관련 인텔리전스 서비스를 제공한다. 전문 분석팀을 보유하고 있다. 인터폴을 비롯해 국내외 주요 기관과 통신·금융·이커머스·반도체 등 주요 산업의 기업을 고객으로 확보하고 있다. 국군방첩사령부 국군사이버사령부 경찰청 한국인터넷진흥원 등이 주요 고객이다. 2025년 기업공개(IPO)를 추진하고 있다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?