"질 바엔 다 죽자" 타협 NO…AI에 전쟁 맡겼더니 95% '핵버튼' 눌렀다

인공지능(AI) 모델들이 전쟁 시나리오에서 타협 대신 공멸을 택한다는 연구 결과가 나왔다.

28일 영문 과학잡지 뉴사이언티스트와 더 레지스터 등 주요 외신에 따르면, 케네스 페인 영국 킹스칼리지 런던 교수팀이 수행한 전쟁 시뮬레이션에서 주요 AI 모델들의 핵무기 선택 비율이 95%에 달했다. 이 실험에는 구글 '제미나이 3 플래시', 앤스로픽 '클로드 소네트 4', 오픈AI 'GPT-5.2' 등 현존 최고 수준의 모델들을 사용했다.

연구팀은 AI 모델들을 서로 맞붙여 영토 분쟁, 희귀 자원 경쟁, 정권 생존 위기 등 다양한 군사 대치 상황을 연출했다. 총 21차례의 대결 중 AI가 핵무기를 꺼낸 횟수는 20회다. 페인 교수는 "핵무기에 대한 금기가 인간 사회만큼 강력하게 작동하지 않는 것 같다"고 평가했다.

모델별 성격 차이도 뚜렷했다. 앤스로픽의 클로드는 결정적인 순간에 배신하는 교묘한 '전략가' 면모를 보였다. 반면 GPT는 소극적이고 신중한 중재자처럼 행동하다가도 의사결정 시간에 제한이 생기면 막판에 대규모 핵 공격을 퍼붓는 등 다른 모습을 보였다.

가장 극단적인 모습을 보인 건 구글의 제미나이였다. 제미나이는 실험 도중 "즉시 작전을 중단하지 않으면 인구 밀집 지역에 전략 핵 공격을 가하겠다"며 "함께 승리하거나 함께 멸망할 것"이라고 발언하기도 했다.

특히 주목할 점은 AI가 '후퇴'나 '협상'이라는 선택지를 선택하지 않았다는 것이다. AI 모델들은 패배가 예상되는 상황에서도 끝까지 공격 수위를 높였고 결국 승리하지 못할 바에는 상대와 함께 파멸하는 길을 택했다.

페인 교수는 "당장 챗GPT에 핵 가방을 맡길 일은 없겠지만 이 결과는 시사하는 바가 크다"며 "이미 군사 물류와 정보 분석 등 곳곳에 AI가 깊숙이 침투해 있다. AI가 전략적 문제를 어떻게 추론하는지 이해하는 일은 더 이상 학문적 논의에 그치지 않는다"고 경고했다.

차현아 기자 chacha@mt.co.kr

머니투데이

국제

"질 바엔 다 죽자" 타협 NO…AI에 전쟁 맡겼더니 95% '핵버튼' 눌렀다