"질 바엔 다 죽자" 타협 NO…AI에 전쟁 맡겼더니 95% '핵버튼' 눌렀다

차현아 기자 2026. 2. 28. 15:43
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI) 모델들이 전쟁 시나리오에서 타협 대신 공멸을 택한다는 연구 결과가 나왔다.

28일 영문 과학잡지 뉴사이언티스트와 더 레지스터 등 주요 외신에 따르면, 케네스 페인 영국 킹스칼리지 런던 교수팀이 수행한 전쟁 시뮬레이션에서 주요 AI 모델들의 핵무기 선택 비율이 95%에 달했다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

/사진=유토 이미지, 뉴시스

인공지능(AI) 모델들이 전쟁 시나리오에서 타협 대신 공멸을 택한다는 연구 결과가 나왔다.

28일 영문 과학잡지 뉴사이언티스트와 더 레지스터 등 주요 외신에 따르면, 케네스 페인 영국 킹스칼리지 런던 교수팀이 수행한 전쟁 시뮬레이션에서 주요 AI 모델들의 핵무기 선택 비율이 95%에 달했다. 이 실험에는 구글 '제미나이 3 플래시', 앤스로픽 '클로드 소네트 4', 오픈AI 'GPT-5.2' 등 현존 최고 수준의 모델들을 사용했다.

연구팀은 AI 모델들을 서로 맞붙여 영토 분쟁, 희귀 자원 경쟁, 정권 생존 위기 등 다양한 군사 대치 상황을 연출했다. 총 21차례의 대결 중 AI가 핵무기를 꺼낸 횟수는 20회다. 페인 교수는 "핵무기에 대한 금기가 인간 사회만큼 강력하게 작동하지 않는 것 같다"고 평가했다.

모델별 성격 차이도 뚜렷했다. 앤스로픽의 클로드는 결정적인 순간에 배신하는 교묘한 '전략가' 면모를 보였다. 반면 GPT는 소극적이고 신중한 중재자처럼 행동하다가도 의사결정 시간에 제한이 생기면 막판에 대규모 핵 공격을 퍼붓는 등 다른 모습을 보였다.

가장 극단적인 모습을 보인 건 구글의 제미나이였다. 제미나이는 실험 도중 "즉시 작전을 중단하지 않으면 인구 밀집 지역에 전략 핵 공격을 가하겠다"며 "함께 승리하거나 함께 멸망할 것"이라고 발언하기도 했다.

특히 주목할 점은 AI가 '후퇴'나 '협상'이라는 선택지를 선택하지 않았다는 것이다. AI 모델들은 패배가 예상되는 상황에서도 끝까지 공격 수위를 높였고 결국 승리하지 못할 바에는 상대와 함께 파멸하는 길을 택했다.

페인 교수는 "당장 챗GPT에 핵 가방을 맡길 일은 없겠지만 이 결과는 시사하는 바가 크다"며 "이미 군사 물류와 정보 분석 등 곳곳에 AI가 깊숙이 침투해 있다. AI가 전략적 문제를 어떻게 추론하는지 이해하는 일은 더 이상 학문적 논의에 그치지 않는다"고 경고했다.

차현아 기자 chacha@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.