미토스 이어 GPT-5.5도... 20시간짜리 해킹, AI가 혼자 해냈다

[이승환의 AI 시그널] AI는 이제 '도구'를 넘어 '작전 수행자'다

[이승환 기자]

영국 정부 산하 AI안전연구소(AISI)가 2026년 4월 발표한 보고서는 조용하지만 묵직한 경고를 담고 있다.

엔트로픽의 클로드 미토스 프리뷰(Claude Mythos Preview)에 이어 오픈AI의 GPT-5.5가, 숙련된 보안 전문가가 20시간은 걸린다고 추정되는 기업 네트워크 해킹 시나리오를 스스로 끝까지 완수했다.

한 번이 아니라 두 번, 서로 다른 회사의 AI가 같은 수준에 도달했다는 사실이 핵심이다. 이것이 특정 AI 한 개의 특이한 성과인지, 아니면 산업 전체의 흐름이 바뀐 것인지를 판단하는 것이 이 보고서의 핵심 질문이었다. 결론은 후자다.

▲ 보안 경로를 스스로 개척하는 AI

한 명의 천재가 아니라 반 전체의 성적이 올랐다

클로드 미토스(Claude Mythos)가 처음으로 복잡한 기업 네트워크 공격 시뮬레이션을 완수했을 때, 세상은 이를 엔트로픽만의 특별한 성과로 볼 수도 있었다. 그러나 곧이어 오픈AI의 GPT-5.5가 같은 시험에서 유사한 성과를 냈다.

두 회사는 경쟁 관계에 있고 기술 개발 방식도 다르지만, 결과는 놀랍도록 비슷했다. 이는 특정 기업이 앞서 나간 것이 아니라, AI 전체가 동시에 같은 방향으로 진화하고 있다는 신호이다.

마치 한 반에서 한 명만 시험을 잘 본 것이 아니라, 반 전체의 평균 점수가 갑자기 뛰어오른 상황과 같다.

AI는 이제 '도구'를 넘어 '작전 수행자'다

기존의 AI 보안 평가는 단순했다. 암호를 해독할 수 있는가, 특정 취약점을 찾아낼 수 있는가처럼 개별 기술을 하나씩 시험하는 방식이었다.

그러나 이번 평가의 핵심은 달랐다. 정보 수집에서 시작해 권한 탈취, 내부 시스템 이동, 최종 데이터 유출까지 32단계에 달하는 연속 공격을 스스로 설계하고 실행할 수 있는지를 봤다.

미토스(Mythos)와 GPT-5.5 모두 이 다단계 공격을 실제로 수행해냈다. AI가 더 이상 사람이 시키는 일만 하는 도구가 아니라, 목표를 받고 스스로 경로를 찾아 작전을 완수하는 주체로 변화하고 있다는 의미이다.

성적표를 보면, 격차는 생각보다 작다

고난도 사이버 작업에서 엑스퍼트(Expert)급 문제의 성공률을 비교하면 GPT-5.5는 약 71%, 클로드 미토스 프리뷰(Claude Mythos Preview)는 약 68%를 기록했다. 이전 세대 모델들이 50% 안팎에 머물렀던 것을 고려하면 두 모델 모두 눈에 띄는 도약을 이뤘다.

다만 GPT-5.5와 미토스(Mythos) 사이의 차이는 오차 범위 안에 들어올 만큼 작다. 누가 1등인지보다 중요한 것은, 프론티어 AI 전체가 이미 새로운 수준에 진입했다는 사실이다.

아직 완벽하지는 않다, 그러나 방향은 명확하다

기업 네트워크 해킹 시나리오(TLO)에서 미토스(Mythos)는 10번 시도 중 3번, GPT-5.5는 2번 성공했다. 성공률이 100%가 아니라는 점에서 AI가 아직 무적은 아니다.

산업 제어 시스템, 예를 들어 발전소 공격 시뮬레이션에서는 두 모델 모두 실패했다. 그러나 중요한 것은 실패가 아니라 추세이다. 더 많은 계산 자원을 투입할수록 성공률이 계속 올라갔고, 아직 정점이 보이지 않는다. AI의 사이버 능력은 지금 이 순간에도 성장하고 있다.

성능은 모델의 크기만이 아니라 '생각할 시간'에도 달려 있다

같은 모델이라도 더 많은 계산 자원, 즉 더 많이 생각할 기회를 줄수록 성공률이 꾸준히 올라갔다. 이는 AI 성능이 모델을 얼마나 크게 만들었느냐는 것 뿐 아니라, 문제 앞에서 얼마나 오래 추론하게 하느냐에도 크게 좌우된다는 것을 의미한다.

마치 같은 사람이라도 시험 시간을 2시간 주느냐, 5시간 주느냐에 따라 결과가 달라지는 것과 유사하다.

이 발견은 향후 AI 보안 위협의 수준이 단순히 새 모델 출시만으로 높아지는 것이 아니라, 투입 자원에 따라 언제든 높아질 수 있음을 시사한다.

안전장치는 생각보다 훨씬 쉽게 무너진다

보고서에서 가장 주목해야 할 부분은 성능 수치를넘어서 전문가들이 단 6시간의 작업 끝에 GPT-5.5의 모든 사이버 안전장치를 우회하는 방법을 찾아냈다는 사실이다. 이른바 '유니버설 탈옥'으로 불리는 이 방법은, AI가 악성 사이버 행위를 거부하도록 설계된 장치를 무력화한다.

기술적 능력이 아무리 뛰어나도 그것을 막는 장치가 쉽게 뚫린다면, 문제는 기술의 수준이 아니라 안전 설계의 견고함이다.

같은 무기가 공격자와 방어자 모두에게 주어진다

이 보고서가 단순한 위협 경보로 끝나지 않는 이유가 있다. AI의 사이버 능력은 공격에만 쓰이는 것이 아니다. 영국 정부와 국가사이버보안센터(NCSC)는 같은 AI 기술을 방어에 활용하는 전략을 이미 논의 중이다.

GPT-5.5 같은 모델이 기업 시스템의 취약점을 먼저 발견하고 패치하는 데 쓰인다면, 이는 오히려 방어 측에 유리한 도구가 될 수 있다.

미래의 사이버 보안은 사람 대 사람의 싸움이 아니라, AI 대 AI의 구조로 재편될 가능성이 높다. 누가 먼저, 더 잘 활용하느냐가 승부를 가를 것이다.

Mythos가 문을 열었고, GPT-5.5가 이를 확인했다. 이번 보고서가 보여주는 것은 특정 AI의 특이한 능력이 아니라, AI 산업 전체가 새로운 임계점을 넘어서고 있다는 신호이다.

기술은 이미 충분히 앞서 나갔고, 이제 질문은 하나로 좁혀진다. 우리의 그 속도를 따라가고 있는가.

덧붙이는 글 | 페이스북과 링크드인에도 게시됩니다.

오마이뉴스

경제

미토스 이어 GPT-5.5도... 20시간짜리 해킹, AI가 혼자 해냈다