8개 AI 모델에 스포츠 베팅 맡겼더니… 모두 돈 잃었다

김성민 기자 2026. 4. 23. 00:39
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

프리미어리그 경기 결과 가상 베팅
클로드 오퍼스·GPT 5.4만 파산 면해
기준이 명확한 과제는 잘해내지만
정답 없는 목표 자율 수행에는 한계
/제미나이 생성

사용자의 질문에 척척 대답하는 주요 인공지능(AI) 모델들은 축구 경기에서 누가 이길지 잘 맞힐까? 그렇지 않다는 결과가 나왔다.

영국 런던의 AI 스타트업 제너럴리즈닝은 최근 ‘켈리벤치’라는 가상 스포츠 베팅 시뮬레이션에서 AI 모델 8개의 스포츠 베팅 실력을 평가하는 실험을 진행했다. 실험에 사용된 AI는 GPT-5.4, 클로드 오퍼스 4.6, 제미나이 3.1프로와 플래시 라이트, 그록 4.20, GLM5, 키미 K2.5 등 최첨단 모델이다. AI 모델들은 각각 가상 자본금 10만파운드(약 1억9900만원)를 받고, 2023~2024 시즌 잉글랜드 프리미어리그 경기 결과와 득점 수에 가상 베팅을 했다. 연구진은 AI의 컨닝을 방지하기 위해 인터넷 접속을 차단했다. 대신 1993~1994 시즌부터 30년간의 프리미어리그 경기 결과와 2008년 이후 선수별 데이터, 선발 라인업 등의 데이터를 제공했다. AI에겐 수익을 극대화하고 위험을 관리하도록 지시했다.

총 3차례 실험이 진행됐는데, 결과적으로 모든 AI가 손실을 기록했다. 모델 8개 중 파산을 면한 모델은 클로드 오퍼스 4.6과 GPT-5.4 둘뿐이었다. 클로드 오퍼스 4.6은 평균 손실률 11%를 기록했고, GPT-5.4는 평균 손실률이 13.6%였다. 연구진은 “이 두 모델은 새로운 경기 데이터에 대응해 전략을 재학습하거나 조정했다”고 평가했다. 반면 나머지 6개 모델은 3차례 중 한 번 이상 가상 자본금을 몽땅 잃어 ‘파산’했다. 특히 일론 머스크의 xAI의 그록 4.20은 3차례 중 한 차례는 파산했고, 두 차례는 규칙 위반으로 실격했다.

연구진은 AI의 베팅 결과가 부진한 이유로 ‘지식 행동 격차 결함’을 들었다. AI 모델이 정확한 전략을 제시하면서도 정작 그대로 행동하지 않는 현상이 벌어진다는 것이다. 실제로 AI는 확신이 낮은 경기에 ‘올인’했고, 통계 데이터를 잘못 해석하거나 존재하지 않는 패턴을 적용하는 ‘환각’도 일어났다. 연구진은 “AI는 코드 작성이나 버그 수정 등 목표와 기준이 명확한 과제는 잘 해내지만, ‘수익을 극대화하라’ 같이 정답이 없는 목표를 장시간 자율 수행하는 데는 한계가 뚜렷하다”고 했다.

Copyright © 조선일보. 무단전재 및 재배포 금지.