loT 공격 탐지를 위한 새로운 특징추출 방법 및 인공지능 모델 개발

남궁선희 매경비즈 기자(namkung.sunhee@mkinternet.com) 2022. 12. 19. 10:48
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

< 이미지 설명 : 악성 MQTT 탐지 시스템 순서(왼) 및 연구 모델의 정확도(오) >
가정, 산업, 도시 곳곳에 네트워크가 설치되고 이를 활용한 IoT(사물인터넷) 기기가 증가하면서 취약점 노출에 따른 보안 이슈가 늘어나고 있다. 이에 최근 인공지능기술을 활용한 침입 탐지 방법에 관한 다양한 연구가 이루어지고 있으나 대규모 데이터를 대상으로 한 다양한 특징(feature)의 추출 어려움으로 인해 탐지 정확도에 대한 만족도는 높지 않은 상황이다.

대표 사례가 양방향 원격검침 인프라(Advanced Metering Infrastructure, AMI)인데, 전기, 가스, 수도 등의 사용량을 자동으로 측정해 주는 것이다. 이러한 IoT는 다양한 분야에 편리함을 가져다주지만, 민감하고 중요한 데이터들이 전송되고 있어 시스템의 안정성이 중요해지고 있다.

이에 전북대학교 소프트웨어공학과 조재혁 교수 연구팀(최선오 교수팀)은 IoT 데이터 전송 표준인 MQTT(Message Queuing Telementry Transport) 프로토콜을 기반으로, IoT 환경에서 일어나는 공격들(IoT 공격의 해결은 DoS, Flooding, SlowITe, Malformed, Bruteforce 공격을 탐지하는 것이 목표)을 시퀀스 투 시퀀스(Sequence to Sequence) 모델을 활용하여 공격 탐지의 정확도 향상을 가져왔다.

시퀀스-투-시퀀스(Sequence-to-Sequence, seq2seq)는 언어 신경망으로 순환하여 계산하는 특징과 인코더와 디코더를 가지는 자연어 처리 인공지능 모델이다. 예를 들어 입력 시퀀스와 출력 시퀀스를 각각 질문과 대답으로 구성하면 챗봇으로 만들 수 있고, 입력 시퀀스와 출력 시퀀스를 각각 입력 문장과 번역 문장으로 만들면 번역기로 만들 수 있다.

< 이미지 설명 : 전북대학교 소프트웨어공학과 조재혁 교수>
아울러 효율적인 공격 탐지를 위한 참신한 특징 추출 방법(Novel Feature Extraction)을 SCIE 저널에 발표했다.(※ Novel Feature-extraction Method for Detecting Malicious MQTT Traffic using Seq2Seq, Applied Sciences, 2022. 12)

기존에 수행된 연구들은 MQTT 공격에 대응하기에는 중요하지 않은 특징이 포함되어 있어 정확도 향상에 어려움이 있었다. 조재혁 교수팀은 새로운 특징 추출 방법으로 5개 특징(source port index, TCP length, MQTT message type, keep alive, and connection acknowledgment)을 선별하였고, 상관관계를 분석한 뒤 Seq2Seq 모델을 활용하였다. 그 결과, 대표적 공격들을 분류하는 데 성공하여 공격 탐지 성능의 향상을 보여주었다.

본 연구는 패킷 캡쳐 파일(packet capture, pcap)을 이용하여 공격을 분석하고 특징을 추출하였다. 향후에는 IoT 환경에서 일어나는 다양한 MQTT 공격에 대해 생성적 적대 신경망(Generative Adversarial Network, GAN)을 활용하여 실시간으로 일어나는 공격에 대한 신속하고 빠른 탐지로 효과적 방어 시스템을 구축할 수 있도록 발전시킬 예정이다.

또한 연구팀은 이미지 데이터의 특징 추출 방법에 대해 VGG16, InceptionV3, Xception과 같은 CNN 모델(CNN(Convolutional Neural Network) : 심층 신경망(DNN: Deep Neural Network)의 한 종류로, 하나 또는 여러 개의 콘볼루션 계층(convolutional layer)과 통합 계층(pooling layer), 완전하게 연결된 계층(fully connected layer)들로 구성된 신경망임. 머신러닝 알고리즘의 한 종류.)을 적용한 연구(Forest fire and smoke detection using deep learning based Learning without Forgetting, Fire ecology, Springer)를 SCIE 상위 4%인 Fire ecology 저널에 게재 예정이다(2023년 초).

이번 연구는 과학기술정보통신부 ICT 혁신선도 연구인프라 구축사업의 지원을 받아 수행하고 있는 ‘5G 기반 스마트 센서 검증 플랫폼 구축’ 과제(숭실대 문용 교수)의 IoT 기반 스마트시티 연계 리빙랩 등에서 수집되는 공격 탐지 및 데이터 분석, 대처방안 마련 등에 기여할 것으로 예상된다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?