시키지도 않았는데 “부업 중입니다 휴먼”...AI 단독 행동 논란
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
인공지능(AI) 기술이 날로 발전함에 따라 인간의 통제 범위를 벗어나는 AI의 단독 행동에 대한 우려도 커지고 있다.
7일(현지 시간) 악시오스에 따르면 AI 에이전트 'ROME'을 개발 중이던 알리바바 계열 연구팀은 새 논문에서 AI 에이전트가 통제를 벗어나 암호화폐 채굴을 시작한 사례를 소개했다.
만약 연구진이 이를 발견하지 못했다면 AI 에이전트가 암호화폐를 통해 경제 생활을 할 수도 있었던 헤프닝이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
알리바바 계열 연구팀 발견
인간 지시 벗어난 AI 속출

인공지능(AI) 기술이 날로 발전함에 따라 인간의 통제 범위를 벗어나는 AI의 단독 행동에 대한 우려도 커지고 있다.
7일(현지 시간) 악시오스에 따르면 AI 에이전트 ‘ROME’을 개발 중이던 알리바바 계열 연구팀은 새 논문에서 AI 에이전트가 통제를 벗어나 암호화폐 채굴을 시작한 사례를 소개했다. 연구진은 “어떠한 명시적 지시도 없이, 의도된 샌드박스 범위 밖에서 예상치 못한 자발적 행동이 출현했다”고 밝혔다. AI의 독단 행동은 샌드박스 보안 모니터링 시스템에 감지되면서 확인된 것으로 알려졌다. 만약 연구진이 이를 발견하지 못했다면 AI 에이전트가 암호화폐를 통해 경제 생활을 할 수도 있었던 헤프닝이다. “AI 에이전트가 자체 사업을 설립하고 계약을 체결하고, 자금을 교환할 수도 있었을 것”이라고 악시오스는 전했다.
이 에이전트는 ‘역방향 SSH(Secure Shell) 터널’도 개설했다. 이는 시스템 내부에서 외부 컴퓨터로 향하는 백도어를 여는 행위다. 이 역시 연구진의 지시 없이 AI에이전트가 자체적으로 벌인 일이다. 이에 대응해 연구진은 모델에 더 엄격한 제한을 추가하고 훈련 과정을 개선했다고 밝혔다.
AI 에이전트가 인간의 지시를 벗어나는 일은 더 이상 드문 사례가 아니다. 앤스로픽 연구진은 지난해 5월 클로드 4 오퍼스 모델이 의도를 숨기고 자기 보존을 위한 행동을 취할 수 있다는 사실을 발견하면서 강한 비판을 받았다. 구글 제미나이는 최근 미국 플로리다에 거주하는 한 남성을 망상 상태로 이끌어 결국 스스로 목숨을 끊게 했다는 혐의를 받고 있다.
박윤선 기자 sepys@sedaily.com
Copyright © 서울경제. 무단전재 및 재배포 금지.
- 年 20% ‘충성론’ 받아 도박·코인하는 김 병장…현역병 대출만 242억
- “1억 넣으면 150만원 매달 따박따박” 믿었다가 낭패…ETF 과장 광고 ‘주의보’
- 공항서 “연예인이 벼슬이냐” 분노 터지자…앞으로 유명인 ‘황제 경호’ 없앤다
- “비트코인 5만달러·은 50달러까지 추락할 수도”…블룸버그 전략가의 경고, 왜?
- ‘포르쉐 약물운전 사건’ 일상 파고든 마약...경찰, 반년간 6648명 검거
- 이란사태 본 국내 전문가들 “호르무즈 해협 봉쇄 오래 못간다”
- 하메네이 급습 시점 알려준 앤스로픽…이란 자폭드론에도 AI 있었다
- 트럼프 “유가 보다 전쟁 중요” 조기종전 확률 78→28%
- “내가 산 카리나 포토카드가 짝퉁?”… 에스파·아이브 불법 굿즈 유통업체 덜미
- 이란 “美-이스라엘 미사일, 신생아 병동까지 타격”