8월15일 맨체스터 시티의 페프 과르디올라 감독(맨 오른쪽)이 토트넘 홋스퍼와의 경기를 지켜보고 있다. ⓒAFP PHOTO

야구인들은 야구에 ‘두뇌 스포츠’라는 별명 붙이기를 좋아한다. 이 표현에는 타 종목에 대한 약간의 우월감이 포함돼 있다. 단체 구기종목 중 한국에서 인기를 양분하는 축구가 자주 비교 대상이 된다.

전문가들의 평가는 다르다. 미국 스포츠 전문채널 ESPN은 2011년 스포츠 전문가 8명에게 의뢰해 60개 종목을 대상으로 난이도를 매겼다. 10개 기준 가운데 ‘두뇌’와 관계되는 항목은 ‘분석력’이다. 야구의 분석력 난이도는 전체 15위로 평가됐다. 축구는? 두 번째로 어려운 종목이었다(1위는 아이스하키였다).

야구와 축구 모두 프로화한 팀 스포츠다. 지적인 능력은 개인뿐 아니라 팀 전술 차원에서도 요구된다. 부유한 구단은 팀을 이기게 만드는 요소에 투자를 아끼지 않는다. ‘전술가’ 역할인 감독의 연봉은 종목 간 전술의 중요도를 비교할 수 있는 기준이 된다.

올해 세계에서 가장 많은 연봉을 받는 축구 감독은 잉글랜드 프리미어리그(EPL)의 페프 과르디올라다. 맨체스터 시티는 올해 과르디올라에게 2300만 유로(약 315억원)를 지불한다. 메이저리그(MLB) 감독으로 최고 연봉을 받는 클리블랜드 인디언스의 테리 프랑코나 감독(420만 달러·약 49억원)보다 6.44배 많다. 감독 연봉 상위 10위 평균으로 따지면 축구 179억원, MLB 29억원으로 축구가 야구의 6.25배다. 2020년 선수 평균 연봉은 MLB가 모든 세계 프로축구 리그를 앞선다는 점과 대조된다.

축구가 야구보다 ‘두뇌 스포츠’에 가깝다면 경기의 속성 때문일 것이다. 축구가 더 복잡하고 야구는 상대적으로 단순한 경기다. 타자는 순서대로 타석에 등장하고 주자는 반드시 한 방향으로 뛰어야 한다. 반면 축구선수가 공을 다룰 때 다음 행동은 자신뿐 아니라 다른 선수들에 의해 결정된다. 그래서 〈뉴욕타임스〉 칼럼니스트인 데이비드 브룩스는 2014년 칼럼에서 “인생은 야구가 아니라 축구다. 나의 결정은 나도 모르는 사이에 주위 사람들에 의해 결정된다”라고 썼다. 상황별로 플레이의 성공 확률이 계산되는 야구는 인생보다는 주사위를 던지는 보드게임을 더 닮았다.

복잡한 경기이기 때문에 축구는 통계적으로 해석하기 어렵다. 스포츠에서 가장 중요한 가치는 승리다. 승리는 득실점의 차이로 결정 난다. 따라서 야구든 축구든 어떤 선수의 득점 기여도가 높은지 측정하고, 어떤 팀을 만들면 득점이 늘어나는지를 예측하는 건 매우 중요하다.

야구의 세이버메트릭스(야구를 통계학적으로 분석하는 방법론)는 이런 질문에 근사치의 답을 제공한다. 1970년대 후반에 이미 타자의 가치를 득점으로 환산하는 RC(Runs Created)라는 통계가 고안됐다. 축구 통계가들도 비슷한 시도를 했다. 1993년을 시작으로 여러 버전의 기대득점(Expected goals, xG) 공식이 개발됐다. 슈팅 시도 위치와 골문과의 거리, 각도, 수비수 숫자, 어시스트 유형, 플레이 패턴 등 여러 변수에 따른 득점 확률을 계산한다. 그리고 슈팅별 득점 확률을 모두 더하는 방식이 기본이다.

하지만 이렇게 산출된 xG는 실제 득점과 차이가 너무 컸다. ‘풋볼레퍼런스닷컴’에 따르면 EPL 2019-2020 시즌에서 토트넘의 xG는 54.5골이었지만 실제 득점은 68골이었다. 풀럼의 xG는 41.3골이었지만 실제 득점은 27골에 그쳤다. 20개 구단의 [(실제 득점-xG)/실제 득점] 값은 –53.0~19.9% 사이였다. 반면 2013년 KBO 리그 9개 구단의 [(실제 득점-RC)/실제 득점] 분포는 –6.19~3.35%로 훨씬 예측력이 높았다.

클리블랜드 인디언스의 테리 프랑코나 감독. ⓒAP Photo

‘통계학자의 천국’인 야구

xG와 실제 득점과의 차이는 지난 시즌 경이적인 골 결정력을 선보였던 토트넘의 포워드 손흥민 같은 ‘아웃라이어(통계 용어로 다른 값들에 비해 월등하게 높거나 낮은 값)’에 의해 발생하기도 한다. 하지만 더 본질적인 이유는 경기의 특성 때문이다. 전반전을 2-0 스코어로 마친 팀은 대개 공격보다 수비를 우선한다. 그래서 실제 능력보다 더 적은 슈팅 기회를 얻어도 만족한다. 반면 야구 경기에서 득점 기회는 아웃카운트 숫자와 비례한다. 아웃카운트가 팀당 27개로 고정돼 있어 선수가 태업을 하지 않는 이상 일부러 득점 기회를 줄일 방법은 없다.

야구는 상대적으로 단순한 경기다. 그렇기 때문에 데이터 결과로 실제 경기를 거의 유사하게 재현할 수 있다. 브룩스의 표현대로 야구가 ‘통계학자의 천국’인 이유다. 하지만 단순히 경기의 속성만으로 ‘천국’은 만들어지지 않았다. 데이터를 만들고 관리하고 해석하려는 오랜 노력이 있었다. 데이터 과학자 세스 스티븐스 다비도위츠는 2017년 출간한 〈모두 거짓말을 한다〉에서 “야구는 거의 모든 것에 대한 포괄적인 데이터 세트를 보유한 최초의 분야였다”라고 설명한다.

이제 야구와 데이터의 결합은 더 높은 수준으로 올라가고 있다. 투구와 타구, 수비수의 움직임, 선수의 생체역학 데이터까지 측정된다. 영화 〈머니볼〉이 다루는 2000년대 초반 세이버메트릭스는 ‘팀 승리를 위해 어떤 선수를 뽑을 것인가’라는 문제에 답을 찾으려는 시도였다. ‘어떻게 하면 야구를 잘할 수 있을까’에는 거의 답을 주지 않았다. 지금은 투구와 타구의 질을 개선하려는 선수와 코치, 트레이닝 전문가들이 데이터를 파고 있다.

야구는 축구에 비해 단순하고, 지적 능력이 덜 요구되며, 인생을 크게 닮은 것 같지도 않은 스포츠다. 하지만 빅데이터 시대에 세상이 어떻게 바뀔 것인지에 관한 힌트는 줄 수 있다. 변화의 결과를 예단하기는 어렵지만, 거스르기 어려운 흐름이라는 점은 분명해 보인다. 다비도위츠는 데이터 과학의 발전에 대해 이렇게 전망했다. “이제는 거의 모든 분야가 야구처럼 되고 있다. 야구가 선두에 서고 다른 모든 분야가 그 뒤를 따른다. 세이버메트릭스가 세상을 삼킨다.”

기자명 최민규(한국야구학회 이사) 다른기사 보기 editor@sisain.co.kr
저작권자 © 시사IN 무단전재 및 재배포 금지
이 기사를 공유합니다
관련 기사