[스프] 6월이면 늦는다…한화-삼성에게 남은 시간은?

배정훈 기자 2023. 4. 14. 13:03
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[야구수다] 상관계수로 보는 KBO리그


오프시즌은 어쩌면 야구팬들에게 가장 행복한 시간입니다. 새로 뽑힌 신인 선수가 어떤 활약을 펼칠지, 거액의 계약을 맺고 옮겨 온 FA 선수가 팀에 얼마나 힘을 보탤지에 대해 '행복회로'를 돌리며 즐거운 상상의 나래를 마음껏 펼칠 수 있는 시간이기 때문입니다.

하지만 본격적인 프로야구 시즌이 시작되면서 희망에 부풀었던 각 팀 팬들의 희비쌍곡선은 엇갈리고 있습니다. 연승을 달리며 시작부터 신바람을 내는 구단이 있는가 하면, 연패의 늪에 빠져 허우적대는 구단도 동시에 존재하기 때문입니다.


물론 아직은 시즌의 10%조차 소화하지 못한 초반의 결과일 뿐입니다. 하지만, 야구팬들은 "이렇게 잘하는 팀이 무너질 리 없어"와 "경기력이 이 지경인데 뭐가 달라지겠어" 사이 어딘가를 벗어나기가 참 힘듭니다.

당장 지난 시즌 개막 10연승을 달린 뒤 한국시리즈 우승까지 차지한 SSG와 개막 6연패 후 정규리그 꼴찌에 그친 한화의 예가 생각날 수밖에 없기 때문입니다. 그렇다면 정말 우리의 '느낌적인 느낌'처럼 초반 기세는 최종적인 팀 성적과 연관성이 높을까요?
 

상관계수 : 낙관성과 행복감부터 학점과 업무 성취도까지

이를 알아보기 위해선 먼저 상관계수에 대한 이해가 필요합니다. 상관계수란 두 변수들 사이의 연관성을 보여주는 –1에서 1사이의 수치인데요, 쉽게 말해 절대값이 1에 가까울수록 둘 사이의 연관성이 높고, 0에 가까울수록 연관성이 적습니다.

이해를 돕기 위해 다른 두 변수 간의 상관계수를 예로 들어보겠습니다.


인종과 성별에 따라 다를 수 있지만, 대체로 키가 큰 사람은 몸무게도 많이 나갑니다. 몸무게가 많이 나가는 사람이 그렇지 않은 사람보다 키가 클 가능성도 더 높죠. 따라서 이 두 변수는 0.7~0.8 사이의 상관계수를 가질 정도로 높은 연관성을 보입니다.

반면, '공부를 열심히 한 사람이 일도 잘한다' '일을 잘하는 사람은 학창 시절 학점이 높았을 것이다'는 어떨까요. 물론 이런 사례도 있겠지만, 아닌 예도 쉽게 찾을 수 있습니다. 학업에 흥미가 없었던 이가 훗날 성공한 스타트업의 CEO가 됐다는 식의 이야기들 말이죠. 공부머리와 일머리가 반드시 일치하는 것은 아니기 때문일 겁니다. 따라서 두 변수 사이의 상관계수는 비교적 낮은 수준에 머무는 것으로 보입니다.

자, 이 정도면 상관계수가 무엇인지 대강이나마 감이 오시리라 믿습니다. 그럼, 이런 지식을 바탕으로 시즌 초 성적과 최종 성적 간의 상관계수를 구해보겠습니다.

'물론 A와 B 사이에 높은 상관관계가 있다'는 말은 'A이면 B이다' 'B는 A에서 나왔다'는 식의 인과관계로 해석되어서는 안 됩니다. 시즌 초의 성적이 최종 성적이라는 결과를 결정짓는 원인이 될 수는 없다는 얘깁니다.

하지만, 여기서 어떤 숫자가 도출되는지를 보고 다른 변수들의 상관계수와 비교하면, 시즌 초반 각 팀의 기세가 최종 성적과 어느 정도의 연관성이 있는지 유추를 해볼 수는 있을 겁니다.
 

4월 초 성적과 최종 성적 : 상관계수 0.437

2007년 시즌 이후 각 팀의 4월 11일까지 성적과 최종 성적 간의 상관계수를 구해봤더니 0.437이라는 값이 나왔습니다. 앞서 예시로 든 상관계수와 비교하자면 '인구밀도가 높은 도시에선 범죄가 많이 일어나고, 범죄가 많이 일어나는 곳은 사람이 많이 사는 곳일 확률이 높다' 정도의 수준인 겁니다. 그럴 법하지만, 반드시 그러리라는 보장은 없어 보이는 정도라고 해도 과장은 아닐 겁니다.

실제 4월 11일까지의 성적과 최종 성적 사이에 2할 이상의 승률 차이가 나는 경우가 33번으로 전체의 23%를 차지했고, 2009년 한국시리즈 우승을 차지한 KIA(0.143 → 0.609), 2017년 정규시즌 꼴찌에 그친 KT(0.778 → 0.347)처럼 극단적인 케이스도 있었습니다.

결국 시즌 초반 몇 경기만으로 최종 성적을 어림짐작하는 건 섣부른 판단일 수 있다는 겁니다.

성적 만회-유지를 위한 분기점 : 5월 31일

그렇다면 언제까지의 성적이 최종 성적으로 이어질 가능성이 높을까요? 이에 대한 답을 얻기 위해 시기를 나누어 상관계수를 분석해 봤습니다.


4월 11일까지의 성적이 최종 성적을 짐작할 수 있는 '개연성'의 영역이라면, 4월 말의 성적은 '손쉬운 추론'의 영역으로 옮아가고, 5월 말일 이후가 되면 '어련히 그럴 법한 일'이 되어 버립니다.

실제 2007년 이후 5월 말 기준 4할 이하의 승률을 기록하고 있었던 팀이 가을야구에 진출한 건 2009년 롯데(0.388→0.496, 4위), 2014년 LG(0.362→0.492, 4위) 두 차례뿐이었고, 6할 대 이상 승률 팀이 가을야구에 진출하지 못한 건 2021년 SSG(0.600→0.508, 6위)가 유일했습니다.

배정훈 기자baejr@sbs.co.kr

Copyright © Copyright ⓒ SBS. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?