빅데이터로 평가하는 K리거의 '과학적' 경기력.. 'xG'에 이어 '선방지수' 등장

김정용 기자 2022. 5. 27. 10:40
음성재생 설정
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[풋볼리스트] 김정용 기자= K리그 현장에서 골키퍼의 선방을 본 관중과 취재진은 얼마나 어려운 슛을 막아냈는지 각자 느낌대로 판단한다. 같은 선방을 보고도 '거의 들어가는 슛을 막았다'라고 생각하는 사람과 '쉽게 막을 만했다'고 생각하는 사람이 갈릴 수 있다. K리그는 빅데이터를 통해 정답에 근접하려는 노력 중이다.


한국프로축구연맹은 지난해부터 양적 데이터를 넘어선 질적 데이터를 도입하기 위해 공식 부가데이터 생산 업체 비프로(Bepro)와 손을 잡고 xG(기대득점)를 도입했다.


xG는 공격수의 각 슛이 얼마나 넣기 어려운 상황이었는지 빅데이터를 통해 계산한 것이다. 비프로는 지난해 xG 도입 시점에 10만 회 넘는 슈팅 데이터를 갖고 있었다. 이 자료를 인공지능(AI)이 계산해서 골문과의 거리, 골문에 대한 각도, 패스 연결 상황, 다이렉트 슛 여부 등에 따라 얼마나 넣기 어려운 슛인지 확률을 산출한다. 확률이 낮은 슛을 넣었다는 건 그만큼 그 선수의 결정력이 높다는 뜻이 된다.


과거에는 선수가 넣은 골의 숫자만 볼 수 있었을 뿐 결정력에 대한 평가는 스카우트들의 주관적인 시각에 맡겼지만, 지금은 선수 결정력을 AI가 계산해주는 시대다. 예를 들어 지난 5월 10일 시점에서 잉글랜드 프리미어리그(EPL) 득점 1위 모하메드 살라(22골)와 손흥민(21골)의 골 차이는 1골에 불과했다. 하지만 xG는 살라가 22.43인 것에 비해 손흥민은 13.11에 불과했다. 손흥민이 훨씬 xG가 낮은 시즌을 보냈는데도 살라와 거의 같은 득점을 올렸다는 건 그만큼 결정력이 높다는 의미가 된다.


한국프로축구연맹은 지난해 K리그의 xG를 대중에게 공개한 데 이어 올해는 이 데이터를 골키퍼에게 적용한 선방지수도 공개하기 시작했다. 각 골키퍼가 막아야 했던 유효슛의 xG를 거꾸로 활용하면 골키퍼가 얼마나 어려운 슛을 막아냈는지 산출할 수 있다.


선방지수는 골키퍼가 맞이했던 xG에서 실제 실점을 뺀 값이다. 선방지수가 양수(+)인 경우에는 예상 실점보다 적은 골을 내줬으므로 긍정적인 수치고, 음수(-)인 경우 예상 실점보다 더 많이 골을 내줬다는 뜻이 된다.


기존 골키퍼 관련 데이터는 세이브, 캐칭, 펀칭, 공중볼 처리 등 횟수 위주의 양적 데이터가 전부였다. 앞으로는 질적 데이터에 해당하는 'GK 선방지수'를 통해 어떤 골키퍼가 얼마나 많은 실질적인 선방을 해냈는지도 확인할 수 있다.


예를 들어 17일 프로연맹이 공개한 K리그1 1~12라운드 자료에 따르면 7경기 이상 출장 골키퍼 중 선방지수 1위는 인천유나이티드의 김동헌이다. 김동헌은 피유효슛이 40개였고, 그 유슛들의 xG 합계는 12.54였다. 그런데 실제 실점은 9골이어서 선방지수가 3.54였다. 거칠게 해석하면 선방 능력을 통해 3.54골을 덜 내줬다는 뜻이다. 2위 양한빈(서울. 3.09) 3위 김동준(제주, 2.71) 4위 오승훈(대구, 2.69) 5위 유상훈(강원, 1.68)이 선방 능력 좋은 선수로순위에 올랐다. K리그2 1위는 이승빈(안산, 6.56)이었다.


이처럼 빅 데이터를 활용하면, 기존에는 측정하기 어려웠던 각 상황의 성공률과 난이도를 계산할 수 있게 된다. 축구 빅데이터를 수집하고 통계로 활용하는 전문가들의 궁극적인 목표는 딥러닝을 통해 구글의 알파고가 바둑을 정복한 것처럼 축구의 모든 부분을 '축구 알파고'가 해석할 수 있도록 하는 것이다. 그러나 현재로선 지나치게 어려운 작업이므로, 슛 상황에 한정해서 AI가 빅데이터를 해석한 xG와 선방지수로 이어졌다.


프로연맹은 앞으로 각 팀별 전방 압박의 강도를 측정하는 압박지수라는 새로운 데이터를 개발할 예정이다. 프로연맹 관계자는 "K리그 경기 데이터는 계속 진화 중"이라며 꾸준히 발전시키겠다는 의지를 밝혔다.



프로연맹이 공식기록에 포함되는 득점, 도움, 출전시간 등을 넘어 부가데이터를 수집하기 시작한 건 2015년 부터다. 부가데이터는 영상분석이나 트래킹을 통해 수집되는 패스 횟수, 태클 횟수, 탈압박, 세이브 등 세부 데이터다.


K리그 데이터 포털을 일반 대중도 열람할 수 있도록 공개해 왔지만, 단순 나열한 자료만으로는 전문가가 아닌 이상 누가 좋은 선수인지 직관적으로 파악하기 어려웠다. 그래서 연맹은 부가데이터로 수집된 선수 경기력을 하나의 지표로 정리했다. 다른 종목이나 유럽축구에서 널리 쓰이고 있는 '파워랭킹'이 지난해부터 K리그에도 도입됐다. 지난해는 '다이나믹 포인트' 올해는 스폰서를 반영해 '아디다스 포인트'라는 이름으로 제공된다. 득점, 페널티킥, 도움, 실점 등 공식 기록과 드리블, 키패스, 크로스, 태클, 인터셉트, 차단 등 여러 부가 데이터들을 종합해 총 31개의 경기 데이터가 반영된 점수다.


사진= 한국프로축구연맹 제공

Copyright © 풋볼리스트. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?