[강석기의 과학카페] 데이터 과학으로 본 '손흥민'의 대단함
‘역시 스타성이 있네...’
새해 첫날 아침부터 반가운 소식이 들렸다. 잉글랜드 프리미어리그(이하 EPL) 토트넘에서 뛰고 있는 손흥민 선수가 23/24 시즌 12번째 골을 넣었다. 영국에서는 12월 31일 오후 2시에 시작한 경기이지만 한국 시간으로는 밤 11시로 경기 도중 해가 바뀐다. 손 선수가 우리 시간으로 2024년이 막 시작한 후반 26분에 골을 넣어 새해 선물을 보낸 셈이다.
손흥민은 워낙 유명한 축구 스타이지만 필자의 관심은 경기 다음 날 아침 뉴스에 나오는 골 장면을 보고 감탄하는 정도였다. 다만 21/22시즌 해리 케인이라는 잉글랜드 최고의 골잡이와 짝을 이뤄 EPL 합작골 기록(37골)을 세웠다는 뉴스가 나왔을 때와 23골로 득점왕이 됐을 때 해당 골 장면 모음 동영상을 찾아보기는 했다. 참고로 합작골이란 두 사람이 도움(어시스트)을 주고받아 득점한 경우를 뜻한다. '손케듀오'로 불렸던 두 선수는 지난 시즌까지 47골의 합작골을 기록했다(손흥민 기준 24골 23도움).
● 손흥민과 황희찬의 골 결정력 경쟁
23/24시즌을 앞두고 일어난 변화가 주의를 끌었다. EPL 최강 공격수 두 명을 보유했음에도 토트넘은 우승컵을 들어 올리지 못했고 결국 지친 케인이 독일 분데스리가의 명문 구단 뮌헨으로 떠난 것이다. 게다가 토트넘에는 엔제 포스테코글루라는 무명의 감독이 부임했다. ‘손흥민도 망했네...’ 많은 전문가들도 토트넘이 중하위권으로 떨어질 것으로 예상하며 빨리 팀을 떠나라는 목소리가 커졌다.
그런데 포스테코글루 감독이 손흥민을 토트넘의 새 주장으로 뽑으면서 분위기가 바뀌었다. 처음 비유럽 선수가 주장을 맡고 시즌을 시작한 토트넘은 10경기가 지난 시점에서 1위에 오르며 센세이션을 불러일으켰다. 그 뒤 부상과 징계가 속출하면서 선수층이 얇아져 고전했지만 20경기가 지난 현재 20개 팀에서 5위로 상위권을 유지하고 있다.
여기까지만 해도 축구 드라마를 보는 듯한데 또 다른 사건이 생겨 재미를 더했다. 중위권 팀인 울버햄튼의 공격수 황희찬 선수가 이번 시즌 들어 여러차례 골을 넣기 시작한 것이다. 현재 손흥민은 12골로 공동 3위, 황희찬은 10골로 6위에 올라있다. 시즌이 시작하기 전 누구도 예상하지 못한 상황이 벌어진 것이다.
최근 흥미로운 뉴스가 나왔다. 실제 득점과 기대득점의 차이 순위에서 손흥민이 1위, 황희찬이 공동 2위에 오른 것이다. 기대득점이란 슛을 하는 상황에서 골이 될 확률을 뜻한다. 이 순위가 높을수록 슛의 결정력이 높다는 뜻이다.
손흥민은 기대득점 7.1골에서 실제 12골을 넣어 +4.9이고 황희찬은 기대 득점 5.9골에서 10골로 +4.1이다. 참고로 공동 2위는 웨스트햄의 미드필더 모하메드 쿠두스로 기대득점 1.9에 실제 6골을 넣었다. 예전에 국가대표 시합을 보면 거의 매 경기 나오는, 터무니없이 골대를 빗나가는 슛에 “한국 축구의 고질적인 문제는 문전 처리 미숙(또는 결정력 부족)”이라는 해설자의 한탄을 들었는데 놀라운 반전이 아닐 수 없다.
왜 지금까지 국가대표 경기는 물론 월드컵 경기를 보면서도 기대득점이라는 말을 들어보지 못했을까. 가까운 거리에서 골키퍼와 마주하는 패널티킥의 기대득점은 얼마나 될까. 갑자기 이런 궁금증이 생겼다.
● 경기력의 유용한 지표
먼저 답부터 하면 패널티킥의 기대득점은 0.79이다. 축구 통계업체 옵타(Opta)의 값으로, 업체의 프로그램에 따라 약간 차이가 있다. 5번에 한 번 실축이면 보통이라는 말이다. 참고로 손흥민은 최근 국가대표 평가전과 프리미어리그에서 각각 한 차례 패널티킥 기회를 얻어 모두 넣었다.
예전에는 야구가 통계의 스포츠인 반면 축구는 딱히 분석할 거리가 없는 감(感)의 스포츠라고 생각했지만 2000년대 들어 축구 경기 내용을 정량화해서 분석하려는 시도가 본격적으로 진행됐고 기대득점을 비롯해 여러 개념이 등장했다.
축구 중계를 보면 결과가 과정을 평가하는 기준으로, 90분 내내 밀리다가도 막판에 한 골을 넣어 1대 0으로 간신히 이기면 “정신력의 승리”라며 칭찬을 하고 비슷한 경기 내용이라도 지면 선수는 물론 감독, 심지어 축구협회까지 소환하며 비난한다. 대중은 그렇다고 쳐도 전문가들까지 이런 평가에 매몰되면 축구 발전에 도움이 되지 않는다.
그렇다면 경기력을 객관적으로 평가할 방법은 없을까. 물론 볼 점유율이나 슈팅 수 등 다양한 지표가 있지만 이보다 더 유력한 게 바로 기대득점(expected goal. 이하 xG)이다. 점유율과 슈팅 수는 양에 대한 정보일 뿐이지만 기대득점은 양과 질 모두를 반영하기 때문이다.
축구 경기 90분 동안 패스와 태클, 볼 경합 등 활동이 무려 3000~4000회에 이르지만, 슛은 평균 10~20여 차례에 불과하고 최종 목표인 골은 두세 개가 고작이다. 축구는 각자 골을 비교해 승부를 보는 경기이므로 결국 골을 전후한 상황에 대한 평가가 경기력의 지표일 수밖에 없다. 골을 차기 직전까지의 공격력을 평가한 게 기대득점이고 상대가 슛을 차기 직전까지의 수비력이 기대실점(expected goal against. 이하 xGA)이다. 슛이 골이냐 아니냐의 여부는 슈팅한 선수의 결정력이나 골키퍼의 선방 여부 또는 골대에 맞추는 것 같은 운에 좌우된다.
예전에는 슛 수와 유효슛(골대 안으로 향한) 수로 공격력(상대의 값인 경우는 수비력)을 평가했지만 슛 상황에 따라 골이 될 가능성(확률)이 천차만별이므로 횟수(양)만으로는 제대로 평가할 수 없다. 따라서 슛으로 경기력을 평가하려면 양뿐 아니라 질을 반영해야 한다. 매 슛마다 골이 될 확률인 기대득점을 곱한 뒤 그 값을 더한 게 바로 그 경기의 총 기대득점이다.
그렇다면 슛의 기대득점을 어떻게 산출할까. 업체마다 세부적인 기준은 차이가 있지만 기본 원리는 같다. 먼저 위치를 보면 골대에서 가까울수록, 각이 정면에서 가까울수록 기대득점 값이 크다. 예를 들어 새해 선물인 손흥민 선수의 12호 골은 거리는 가까웠지만 왼쪽 사각(死角)이라 xG가 0.09에 불과했다. 100번 차면 9번 골이 되는 확률이다. 그리고 슈팅할 때 수비수 여부와 인원, 거리, 골키퍼의 위치도 변수이고 드리블한 공인지 크로스를 받은 공인지에 따라 다르다. 또 머리인지 발인지, 발일 경우 주발인지 약발인지에 따라 점수가 다르다.
슛 수에서 10대 3으로 앞서고 유효슛 수에서도 4대 1로 앞섰음에도 골은 0대 1이면 다들 경기에서 이기고 승부에서 졌다며 억울해한다. 그런데 슛의 질까지 평가해보니 다들 중거리 슛 아니면 수비가 밀집된 상태라 10개 슛의 기대득점을 다 합쳐도 0.6에 불과한데 상대는 3개 슛의 기대득점 합이 0.9이고 골문 앞에서의 결정적인 기회(기대득점 0.7)를 골로 만들었다면 경기력에서도 밀린 것이다.
물론 기대득점으로 비교해 경기력에서 월등히 앞섰는데 승부에서 비기거나 심지어 지는 경우도 종종 있다. 예를 들어 세계 최강 클럽인 맨체스터시티와 토트넘의 프리미어리그 14라운드 경기의 기대득점은 2.6 대 0.5였지만 결과는 3:3 무승부였다. 맨체스터시티는 예상대로 득점한 셈이지만 토트넘은 한 골 넣기도 힘든 경기력에서 무려 3골을 넣었다. 이 경기 하이라이트를 보면 손흥민의 첫 골부터 세 골 모두 기대득점 0.1 내외의 원더골이다.
한 팀의 경기 기대득점과 기대실점은 각각 공격력과 수비력을 보여주는 지표이고 가끔 경기 승패가 어긋나는 건 그날 슈팅한 선수나 막는 상대 수비수(주로 골키퍼)의 컨디션이나 운 때문이라고 넘어갈 수도 있지만 어긋나는 빈도가 잦다면 다른 변수가 경기력에 상당한 영향을 미친다는 뜻이다.
● 토트넘과 첼시의 차이
20라운드가 지난 현재 프리미어리그 5위인 토트넘과 10위인 첼시를 보자. 매 경기의 기대득실점대로 승부가 났다면 토트넘은 11승 9패로 기대승점 33점인 9위다. 그런데 실제는 12승 3무 5패 승점 39점으로 6점 더 높다. 반면 첼시는 기대득실점대로면 14승 1무 5패로 기대승점 43점인 3위임에도 실제로는 8승 4무 8패로 승점 28점에 불과해 무려 15점이나 낮아 10위로 처졌다.
여기에는 운도 어느 정도 작용했겠지만 슈팅하는 선수의 골 결정력 또는 골키퍼의 선방 능력이 주요 변수다. 축구통계업체 언더스탯(understat)의 데이터에 따르면 토트넘의 20경기 합계 기대득점은 37.7골이고 기대실점은 36.7점으로 불과 1점 차이다. 그런데 실제 득점은 42점, 실점은 29점으로 13점이나 차이가 난다. 기대보다 더 넣고 덜 먹었다는 말이다.
반면 첼시의 20경기 합계 기대득점은 42점으로 기대실점 30.6점보다 11.4점 더 많다. 그런데 실제 득점은 34점, 실점은 31점으로 차이가 3점에 불과하다. 기대보다 8골이나 덜 넣은 게 중위권에 머문 배경이다.
기대득실점에 따르면 +1로 경기력이 중위권에 불과한 토트넘이 선전한 건 손흥민과 골키퍼 굴리엘모 비카리오 덕분이라는 주장이 있는데, 한국 사람들이 듣기 좋으라고 하는 말이 아니다.
언더스탯 데이터에 따르면 20라운드 현재 프리미어리그 모든 경기의 기대득점 합계는 652.4골이고 실제 득점은 616골로 36.4골이 더 적다. 과거 경기의 슛을 분석해 기대득점을 산출한 것이므로 올해 공격수들의 결정력이 예전만 못하거나 골키퍼들이 선방을 많이 한 결과로 볼 수 있다. 아무튼 이에 따르면 20개 팀의 평균 득점(실점)은 30.8골로 평균 기대득점(기대실점)은 32.6보다 1.8골이 적다.
토트넘은 기대득점 37.7골에 실제 42골을 넣었으니 리그 평균인 35.6(37.7×616÷652.4)에 비해 6.4골이나 더 넣은 셈이다. 손흥민 선수가 기대득점보다 4.9골을 더 넣었으니 가장 크게 기여했다. 한편 기대실점 36.7골에 실제 29골을 잃었으니 리그 평균인 34.7골 대비 5.7골 덜 먹었고 이는 거의 비카리오의 신들린 선방 덕분이다. 토트넘이 주전들의 연이은 부상과 징계로 경기력이 떨어졌음에도 버틸 수 있었던 배경이다.
● 월드클래스 공격수의 자격
결정적 기회를 뜻하는 빅찬스(big chance)라는 말도 축구 통계에서는 ‘기대득점 0.3 이상의 기회’로 정의해 쓰고 있다. 월드클래스 스트라이커라면 결정적 기회가 왔을 때 골로 만들어야 한다. EPL에서 흥미로운 통계를 발표했는데 20라운드 현재 빅찬스 미스, 결정적 기회에서 골을 넣은 데 실패한 횟수 순위를 매긴 것이다.
리버풀의 공격수 다윈 누녜스가 1위로 빅찬스 미스가 무려 18개나 된다. 그 결과 기대득점이 11.1이나 되지만 실제 넣은 건 5골에 불과하다. 득점 12골로 공동 3위인 손흥민은 빅찬스 미스가 불과 3개로 까마득한 아래인 공동 47위다. 황희찬도 5개에 불과해 공동 21위다.
다만 실제 득점과 기대득점의 차이가 크다고 뛰어난 공격수인 건 아니다. 기대득점 값이 작으면 아무리 결정력이 좋아도 득점에 한계가 있기 때문이다. 기대득점은 주변 선수들의 도움뿐 아니라 위치 선정 등 본인의 능력에 좌우된다. 물론 포지션도 중요해 중앙공격수가 유리하다.
기대득점과 골 결정력 둘 다 높은 대표적 공격수가 해리 케인으로 EPL에서 활약한 9시즌 동안 기대득점이 182골이나 되고 실제 득점도 무려 210골로 28골을 더 넣었다(+15%). 참고로 손흥민은 EPL 통산 기대득점 86골에 실제 득점 115골로 29골을 더 넣었다(+34%). 케인은 페널티킥 30골(34번 찼으므로 기대득점은 27골)이 포함돼 있고 포지션도 중앙공격수로 왼쪽공격수인 손흥민보다 유리해 기대득점 능력이 정비례해 차이가 난다고 볼 수는 없지만 손흥민보다 뛰어난 건 사실이다. 반면 골 결정력은 34%를 더 넣은 손흥민이 한 수 위다.
● 해리 케인, 손흥민 덕에 도움왕 돼
한편 기대도움(expected assist)이라는 개념도 있다. 기대득점을 슈팅 직전 패스를 한 선수에게 부여한 것이다. 실제 도움과 기대도움의 차이는 패스를 받아 슈팅한 선수나 상대 골키퍼의 능력과 운에 좌우된다. 예를 들어 손흥민은 20라운드 현재 도움 5개로 기대도움 6.1에 약간 못 미친다.
선수 개인의 골 결정력에 따라 실제 득점과 기대득점이 차이가 나는 반면 활동 기간이 길면 실제 도움이 기대도움과 비슷해진다. 슈팅하는 선수와 막는 골키퍼가 여럿이라 개인 능력 효과가 상쇄되기 때문이다. 실제 손흥민의 EPL 통산 도움은 57개로 기대도움 53개보다 4개 더 많다.
손케듀오는 20/21 시즌에만 무려 14개의 합작골을 만들어 EPL 단일 시즌 최다 기록도 세웠는데 케인 기준 5골 9도움이다. 이 시즌 케인은 23골 14도움으로 EPL에서 3번째로 득점왕과 도움왕을 동시에 차지했다. 그런데 당시 케인의 기대도움은 7.6으로 6.4나 적다. 이 시즌 손흥민은 17골을 넣었고 기대득점은 11에 불과했다. 참고로 도움 2위는 맨시티의 케빈 더브라위너로 12개를 기록했는데 기대도움은 11로 케인보다 3.4나 더 많았다. 손흥민의 놀라운 결정력으로 얻은 도움 9개가 아니었다면 케인이 도움왕에 오르지는 못했을 것이다.
기대도움 0.3 이상인 경우를 빅찬스 창출(big chance created)이라고 부르는데, EPL 20라운드 현재 순위를 보면 리버풀의 모하메드 살라가 17회로 1위이고 손흥민이 11회로 3위다. 참고로 살라는 득점 14개, 도움 8개로 둘 다 리그 공동 1위다. 두 사람은 골만 잘 넣는 게 아니라 동료들이 골을 넣게 해준다는 말이다.
● 진흙에서 진주 찾는 법
뜻밖에도 2000년대 중반 기대득점 개념이 나온 뒤에도 한동안은 미디어는 물론이고 현장 전문가들조차 받아들이지 않았다. 오히려 도박업체들이 승부 예측에 이를 활용해 꽤 재미를 봤다. 그러다가 축구 통계업체인 옵타가 기존 경기의 수많은 슈팅을 분석해 기대득점을 산출하는 프로그램을 개발해 2012년부터 경기가 끝나면 기대득점 데이터를 제공했지만 초기에는 관심을 받지 못했다. 현재는 기계학습으로 기존 경기의 50만 개가 넘는 슈팅을 분석해 기대득점을 산출하는 인공지능 프로그램 퀸(Qwinn)을 개발해 쓰고 있다.
실제 2017년 프리미어리그 아스널의 아르센 벵거 감독이 맨체스터에 1:3으로 지고 나서 “보다시피 기대득점으로는 그들이 0.7이고 우리가 0.6인 매우 팽팽한 경기로 그들이 우리보다 0.1 더 창출한 게 전부”라고 말했다가 변명도 가지가지라며 홈팬은 물론 언론에서도 비난을 받았다.
그런데 그 무렵 잉글랜드 챔피언십(2부)리그의 브렌트퍼드가 기대득점을 비롯한 데이터를 바탕으로 선수를 뽑아 대성공을 거두며 축구 전문가는 물론 언론도 기대득점의 중요성을 깨닫기 시작했다. 베팅 산업으로 돈을 번 매튜 벤엄은 브렌트퍼드의 열렬한 팬으로 2012년 재정 위기에 빠진 구단을 인수했다. 벤엄은 통계의 중요성을 강조했지만 감에 의지한 전통적인 방식을 고집하던 코치진과 갈등하다 결국 감독을 해고하고 자신의 철학에 맞는 코치진을 꾸몄다.
2부리그에서도 자산이 밑에서 네 번째였던 브렌트퍼드는 통계 데이터에 기반해 저평가된 선수들을 싼값에 사들여 성적을 내고 비싼 값에 되팔고 또 가성비 좋은 선수를 사는 식으로 경기력을 높였다. 이런 전략으로 브렌트퍼드는 20/21년 시즌에 3위에 올라 75년 만에 1부 리그로 승격했다.
다음 주부터 카타르에서 아시아의 월드컵인 18회 아시안컵이 열린다. 우리나라는 1956년 1회와 1960년 2회에 연속 우승한 뒤 무려 64년 동안 우승컵을 들지 못했다. 현재 프리미어리그 득점 3위와 6위, 최근 프랑스 슈퍼컵을 들어 올린 이강인, 지난해 발롱도르 22위로 수비수 가운데 가장 높은 김민재 등 어느 때보다도 화려한 선수진을 자랑하는 우리나라가 이번에는 꼭 우승했으면 좋겠다. 아울러 경기 해설이나 뉴스에서도 프리미어리그처럼 기대득점 같은 새로운 통계 수치와 그래프가 등장하면 볼 맛이 더 있을 것 같다.
※ 필자소개
강석기 과학칼럼니스트. LG생활건강연구소에서 연구원으로 근무했고 2000년부터 2012년까지 동아사이언스에서 기자로 일했다. 2012년 9월부터 프리랜서 작가로 활동하고 있다. 지은 책으로 《강석기의 과학카페》(1~10권), 《생명과학의 기원을 찾아서》, 《식물은 어떻게 작물이 되었나》가 있다.
[강석기 과학 칼럼니스트 kangsukki@gmail.com]
Copyright © 동아사이언스. 무단전재 및 재배포 금지.