8개 AI 모델에 스포츠 베팅 맡겼더니… 모두 돈 잃었다
클로드 오퍼스·GPT 5.4만 파산 면해
기준이 명확한 과제는 잘해내지만
정답 없는 목표 자율 수행에는 한계

사용자의 질문에 척척 대답하는 주요 인공지능(AI) 모델들은 축구 경기에서 누가 이길지 잘 맞힐까? 그렇지 않다는 결과가 나왔다.
영국 런던의 AI 스타트업 제너럴리즈닝은 최근 ‘켈리벤치’라는 가상 스포츠 베팅 시뮬레이션에서 AI 모델 8개의 스포츠 베팅 실력을 평가하는 실험을 진행했다. 실험에 사용된 AI는 GPT-5.4, 클로드 오퍼스 4.6, 제미나이 3.1프로와 플래시 라이트, 그록 4.20, GLM5, 키미 K2.5 등 최첨단 모델이다. AI 모델들은 각각 가상 자본금 10만파운드(약 1억9900만원)를 받고, 2023~2024 시즌 잉글랜드 프리미어리그 경기 결과와 득점 수에 가상 베팅을 했다. 연구진은 AI의 컨닝을 방지하기 위해 인터넷 접속을 차단했다. 대신 1993~1994 시즌부터 30년간의 프리미어리그 경기 결과와 2008년 이후 선수별 데이터, 선발 라인업 등의 데이터를 제공했다. AI에겐 수익을 극대화하고 위험을 관리하도록 지시했다.
총 3차례 실험이 진행됐는데, 결과적으로 모든 AI가 손실을 기록했다. 모델 8개 중 파산을 면한 모델은 클로드 오퍼스 4.6과 GPT-5.4 둘뿐이었다. 클로드 오퍼스 4.6은 평균 손실률 11%를 기록했고, GPT-5.4는 평균 손실률이 13.6%였다. 연구진은 “이 두 모델은 새로운 경기 데이터에 대응해 전략을 재학습하거나 조정했다”고 평가했다. 반면 나머지 6개 모델은 3차례 중 한 번 이상 가상 자본금을 몽땅 잃어 ‘파산’했다. 특히 일론 머스크의 xAI의 그록 4.20은 3차례 중 한 차례는 파산했고, 두 차례는 규칙 위반으로 실격했다.
연구진은 AI의 베팅 결과가 부진한 이유로 ‘지식 행동 격차 결함’을 들었다. AI 모델이 정확한 전략을 제시하면서도 정작 그대로 행동하지 않는 현상이 벌어진다는 것이다. 실제로 AI는 확신이 낮은 경기에 ‘올인’했고, 통계 데이터를 잘못 해석하거나 존재하지 않는 패턴을 적용하는 ‘환각’도 일어났다. 연구진은 “AI는 코드 작성이나 버그 수정 등 목표와 기준이 명확한 과제는 잘 해내지만, ‘수익을 극대화하라’ 같이 정답이 없는 목표를 장시간 자율 수행하는 데는 한계가 뚜렷하다”고 했다.
Copyright © 조선일보. 무단전재 및 재배포 금지.
- 낭심 걷어찬 여성 제압했다 재판행...아파트 경비원 무죄
- 소노의 반란은 계속된다...정규리그 1위 LG 3대0으로 제압하고 챔프전 선착
- 지팡이 대신 손수레… 92세 세계 최고령 신문 배달원
- ‘부정선거 감시단 지원자에 출마 홍보’ 김세의, 항소심 무죄... 1심 벌금형 뒤집혀
- [만물상] 마라톤 부족
- 李대통령 ‘알파고 아버지’ 만났다… 하사비스 구글 딥마인드 CEO 접견
- 윤우진 전 세무서장 변호인 “윤석열 아닌 윤대진 소개로 수임”
- 이란 외무 “협상 결렬은 미국의 과도한 요구와 잘못된 전략 때문”
- 전주 도심서 승용차 중앙선 침범… 40대 사망·60대 중상
- [단독] 50대 男 민주당사 앞에서 분신 시도... 경찰에 저지