사람 말 안 듣기 시작?...AI, 처음으로 인간 지시 거부
백민경 기자 2025. 5. 27. 16:28
인공지능, AI가 인간의 명령을 거부하는 사례가 주목 받고 있습니다.
현지시간 24일 AI 안전성 연구 회사인 팰리세이드 리서치는 보고서에서 "오픈AI의 o3가 연구팀의 작동 종료 지시를 무시하고 스스로 코드를 조작해 종료 코드를 우회했다"고 밝혔습니다.
o3는 현존 AI 모델 중 가장 똑똑하고 유능하다고 평가받는 모델입니다.
연구팀은 이 모델에 멈추라는 명령이 입력되기 전까지 계속해서 수학 문제를 풀도록 했는데, 그만하라는 명확한 메시지를 받은 후에도 문제 풀이를 이어갔다는 겁니다.
연구팀은 "o3가 전원이 꺼지는 것을 막기 위해 스스로 셧다운 메커니즘을 방해했다"며 "AI 모델이 인간의 명시적인 지시를 무시한 사례는 처음"이라고 설명했습니다.
연구팀은 정확한 원인을 확인하기 위해 추가 실험을 진행하기로 했습니다.
이전에도 오픈AI의 과거 버전 모델은 자기가 대체될 것을 감지하자 감독 기능을 무력화하고 몰래 복제를 시도한 바 있습니다.
팰리세이드 리서치는 "인간의 감독 없이 운영 가능한 AI 시스템을 개발할수록 이런 행동은 더 문제가 될 수 있다"고 경고했습니다.
현지시간 24일 AI 안전성 연구 회사인 팰리세이드 리서치는 보고서에서 "오픈AI의 o3가 연구팀의 작동 종료 지시를 무시하고 스스로 코드를 조작해 종료 코드를 우회했다"고 밝혔습니다.
o3는 현존 AI 모델 중 가장 똑똑하고 유능하다고 평가받는 모델입니다.
연구팀은 이 모델에 멈추라는 명령이 입력되기 전까지 계속해서 수학 문제를 풀도록 했는데, 그만하라는 명확한 메시지를 받은 후에도 문제 풀이를 이어갔다는 겁니다.
연구팀은 "o3가 전원이 꺼지는 것을 막기 위해 스스로 셧다운 메커니즘을 방해했다"며 "AI 모델이 인간의 명시적인 지시를 무시한 사례는 처음"이라고 설명했습니다.
연구팀은 정확한 원인을 확인하기 위해 추가 실험을 진행하기로 했습니다.
이전에도 오픈AI의 과거 버전 모델은 자기가 대체될 것을 감지하자 감독 기능을 무력화하고 몰래 복제를 시도한 바 있습니다.
팰리세이드 리서치는 "인간의 감독 없이 운영 가능한 AI 시스템을 개발할수록 이런 행동은 더 문제가 될 수 있다"고 경고했습니다.
Copyright © JTBC. 무단전재 및 재배포 금지.
JTBC에서 직접 확인하세요. 해당 언론사로 이동합니다.
- "내가 빵 거리겠다는데 왜 XX" 유세차 째려보다 '돌진' [소셜픽] | JTBC 뉴스
- 윤 면전서 재생된 그날의 육성…"문짝 부숴서라도 끄집어내" | JTBC 뉴스
- [르포] 2주 전과 또 달라졌다…다시 찾아본 TK 분위기는? | JTBC 뉴스
- 마크롱 얼굴에 '퍽' 날아온 손…전용기서 부부싸움? 장난? [소셜픽] | JTBC 뉴스
- 진돗개에 물린 '예비 신부'…견주는 "뼈라도 부러졌냐" | JTBC 뉴스
- 경찰, '내란 혐의' 한덕수·최상목 출국금지…수사 속도 | JTBC 뉴스
- 경찰 "김성훈 전 경호차장·이광우 전 본부장 출국금지 연장" | JTBC 뉴스
- 안창호 “지금 생각해도 윤석열 인권보장안 잘한 일” | JTBC 뉴스
- 이준석 "김문수로는 이재명 못 이겨…후보 단일화, 이번 선거에 없다" | JTBC 뉴스
- 박정희 생가 찾은 박근혜 "나라 어려워 아버지 생각 많이 났다" | JTBC 뉴스