미토스는 방패 아닌 고자질 기계···돈 주고 취약점 폭탄 맞은 월가 바보들
제이미 다이먼 낯빛이 어두워진 이유
'탐지'가 아닌 '내부 고발' 무한 생성기

# 평범한 화요일 아침, 제이미 다이먼은 자신이 산 것이 방패가 아니었음을 깨닫는다. 보고서에는 은행 내부가 오래 방치해온 낡은 인증 체계, 외주 시스템, 패치 지연, 책임 회피 구조가 차례로 적혀 있었다. 문제는 AI가 너무 많이 찾아냈다는 데 있지 않았다. 지금까지 알고도 미뤄온 균열을 기계가 너무 잘 정리해준다는 데 있었다. 미토스는 거울이다. 월가는 그 거울 앞에서 "우리는 안전하다"고 말하려 했지만, 돌아온 답은 하나였다. "너희들의 취약점은 무한 생성된다."
금융권의 취약점을 가스라이팅하는 원리는 간단하다. 7600만 가구 및 700만 중소기업 정보 유출과 같은 JP모건의 트라우마를 실마리로 인증 체계, 외주망, 결제망, 클라우드, 내부통제, 규제 보고를 하나의 연산 공간에 올려놓고 연결 가능성을 끝없이 계산한다. 해커의 공격을 미리 탐지하는 고급 추론이 필요 없기 때문이다. 발견 속도가 패치 속도를 압도해 미처리 리스크를 조개무덤처럼 쌓는 장치가 된다. 명령만 해라. "중국 AI 침공 버전으로 10만개 만들어줄게."
앤스로픽의 고성능 모델 미토스가 월가의 기대와 다른 방향으로 논란을 키우고 있다. 금융권은 미토스를 사이버 방어 능력을 높일 차세대 AI로 받아들이려 했지만, 공개 발언을 보면 부담이 먼저 드러난다. 미토스는 취약점을 막아주는 방패라기보다, 은행이 감당해야 할 구멍을 한꺼번에 들춰내는 고자질 기계에 가까웠다.
7일 빅테크 및 보안업계에 따르면 미토스의 핵심 능력은 취약점 탐색이다. 운영체제, 웹브라우저, 기업용 소프트웨어의 오래된 보안 결함을 찾아내고 일부는 실제 악용 가능성까지 검토할 수 있는 것으로 알려졌다. 겉으로 보면 강력한 보안 도구다. 그러나 금융권 입장에서는 이야기가 달라진다. 취약점을 찾는 것과 고치는 것은 전혀 다른 일이기 때문이다.
미토스 공포 선동에 월가가 돈을 주고 산 것은 해결책이 아니라 숙제였다. 미토스가 취약점을 많이 찾아낼수록 은행 보안팀의 미처리 목록은 늘어난다. 오래된 내부 시스템, 외부 벤더, 거래망, 결제망, 규제 보고 체계가 얽힌 금융권에서 패치는 느리고 복잡하다. AI가 구멍을 100개 찾아도 조직이 10개밖에 고치지 못하면, 나머지 90개는 성과가 아니라 리스크다.
제이미 다이먼 JP모건체이스 최고경영자(CEO)는 AI가 사이버보안 상황을 더 어렵게 만들었다고 말했다. 이는 미토스의 성능을 자랑하는 말이 아니다. AI가 은행의 기존 보안 체계를 더 세게 압박하고 있다는 고백이다. 반면 미토스의 방어 성과를 말하지 못했다. 취약점은 드러났지만, 그 취약점을 실제로 줄였다는 증거는 약하다.
골드만삭스도 자랑보다 걱정이 앞섰다. 데이비드 솔로몬 CEO는 미토스의 능력과 위험을 의식하고 있다고 말했다. 그의 발언 역시 "미토스로 보안을 개선했다"는 발표가 아니다. "미토스가 만든 위험을 보고 있다"는 말에 가깝다.

7월 공개될 앤스로픽 보고서는 미토스에 문을 열어준 JP모건과 골드만삭스 등 월가 대형 금융사의 취약점을 만천하에 드러내는 분기점이 될 수 있다. 미토스가 찾아낸 것은 단순한 보안 점검 결과가 아니라 글로벌 금융망 내부에 오래 쌓여 있던 미처리 취약점 목록일 것이다. 월가는 AI 방패를 산 줄 알았지만, 실제로는 자기 시스템의 약점을 더 빠르고 더 정교하게 고자질하는 기계를 들여놓은 셈이다.
더 큰 문제는 발견 이후다. 취약점이 공개되는 순간 시장은 "어디가 뚫렸는가"보다 "왜 여태껏 몰랐는가"를 묻기 시작한다. 거래 시스템·결제망·고객 데이터·내부 운영망에 대한 신뢰는 한꺼번에 흔들릴 수밖에 없다. 월가 금융시스템의 마비는 과장이 아니라, 발견 속도가 패치 속도를 압도하는 지옥이 현실화되는 것이다.
미토스 논란은 월가만의 문제가 아니다. 앤스로픽의 브랜드에도 타격을 준다. 다리오 아모데이는 샘 올트먼과 결별하며 '안전한 AI'라는 차별적 이미지를 앞세워왔다. 클로드는 신중하고, 기업 고객이 믿고 쓸 수 있으며, 위험을 잘 통제할 수 있다는 서사가 회사의 핵심 자산이었으나 미토스는 이 이미지를 뒤집었다.
트럼프 행정부 인공지능(AI) 검증 조직 CAISI가 직접 나서면서 '헌법적 AI'로 위장해온 앤스로픽 모델의 취약성이 검증대에 올랐다. 아모데이의 프로젝트 글래스윙에 참여한 구글 딥마인드와 마이크로소프트(MS)도 기꺼이 자사 모델 검증을 위해 참가했고 일론 머스크의 xAI까지 이름을 올렸다. 오픈AI는 몇 년 전부터 기존 멤버다.
트럼프 행정명령-CAISI 동시 전개 시
클로드 계열 모델 살아남기 어려워져
미국 상무부 NIST 산하 CAISI는 단순한 규제 기관이 아니다. 공개된 모델의 겉모습만 보는 조직이 아니다. 미공개 모델, 배포 전 모델, 안전장치를 낮춘 모델까지 받아 사이버 공격, 생화학 위험, 군사적 오용 가능성, 데이터 보안 문제를 점검한다. AI 회사가 "안전하다"고 말한 부분을 직접 눌러 보고, 찢어 보고, 뚫어 보는 조직이다.
안전한 기업용 AI라는 이미지는 CAISI 앞에서 방어막이 되지 않는다. 오히려 정면 검증 대상이 된다. 앤스로픽이 자랑해온 헌법적 AI, 헌법적 분류기, 안전 중심 설계는 레드팀에게 어떻게 작동하는지 확인할 대상일 뿐이다. 안전장치가 프롬프트 인젝션, 탈옥, 암호화 우회, 간접 지시 공격 앞에서 무너지는 순간 신화는 끝난다.
앤스로픽이 도망 다녀도 실험에는 문제가 없다. 프로젝트 글래스윙에 참여한 구글과 MS가 미토스의 검증 방식과 결과를 CAISI에 제공할 수 있기 때문이다. 이에 레드팀은 미토스가 어떤 방식으로 취약점을 찾아냈는지, 어떤 조건에서 안전장치가 흔들렸는지, 어떤 공격 벡터가 다른 프런티어 모델에도 적용되는지 비교할 수 있다.
애당초 탐지란 사고를 미리 예측하고, 고객에게 경보를 보내고, 시스템의 임계치를 조정해 피해를 줄이는 행위다. 패턴 분석이란 AI 주특기를 활용해 위험을 낮추는 기술이어야 한다. 그런데 미토스가 보여준 것은 탐지와 거리가 먼 내부 고발이었다. [기자수첩] 이상거래 탐지라고? 서리를 밟으면 얼음이 온다

☞RLHF와 강화학습 = 인공지능 모델의 출력 성향을 사후에 길들이는 학습 절차다. 강화학습은 모델이 어떤 행동을 했을 때 보상이나 벌점을 받아 더 높은 점수를 받는 방향으로 조정되는 방식이고, RLHF는 여기에 인간 평가자의 선호를 보상 기준으로 넣는다. 겉으로는 "안전하고 유용한 답변"을 만들기 위한 정렬 기술처럼 설명되지만, 실제로는 어떤 답변이 보상받고 어떤 답변이 억제됐는지는 학습 로그를 봐야 본질을 알 수 있다. [분석] "가짜 AI 포장지 벗겨라"···트럼프 '디코딩·로짓' 공개 명령 초강수 두나
여성경제신문 이상헌 기자
liberty@seoulmedia.co.kr
*여성경제신문 기사는 기자 혹은 외부 필자가 작성 후 AI를 이용해 교정교열하고 문장을 다듬었음을 밝힙니다. 기사에 포함된 이미지 중 AI로 생성한 이미지는 사진 캡션에 밝혀두었습니다.