A팀: 소유권 52%; 총 슈팅 18개; 코너킥 7개
B팀: 소유권 48%; 총 슈팅 14개; 코너킥 5개
이것이 우리가 축구 중계를 볼 때 주로 보는 통계들이다.
이런 숫자들이 어떤 것을 말해주는가? 누가 이겼을지 말할 수 있는가?
글쎄, 사실 이건 2014년 월드컵 4강전에서 A팀은 브라질이고 B팀은 독일이다. 역사적인 7:1 승리로 독일이 결승에 진출했다. 하지만 저 통계들에 의하면 경기는 박빙이었던 것처럼 보인다.
피치 위에서 일어났던 것들을 잘 반영하지 못하는 통계란 최악이다. 간단한 얘기다.
숫자를 세거나, 추가적인 분석 없이 원 데이타를 시청자들 앞에 쏟아내는 것이 수십년 간 TV에서 해 온 것이다. 전술이나 통계를 분석하는 TV 쇼나 웹사이트들이 있지만, 데이타는 가공되고 평가되어야할 필요가 있다. 그러므로 애널리틱 컨텐츠들은 경기 후 온라인에서 벌어진다. 캐주얼한 TV 시청자들은 그 시점에는 더 이상 신경쓰지 않으며 Spielverlagerung.com 와 Statsbomb.com 과 같은 사이트들은 시작하기에 좋은 주류들은 아니다.
Kicker, SportBild 혹은 Spox 같은 웹사이트들은 이적시장 루머나, 사진 그리고 인터뷰를 다룬다. 애널리틱스 기사들은 길고, 이해하기 어려우며, “포그바가 FC바르셀로나 인스타그램에 라이크를 눌렀다. 이적이 임박했나?”와 같은 클릭바이트 기사 보다 적은 트래픽을 생산한다.
2015년 스테판 라이나르츠 (2016년 은퇴, 예전 바이어 레버쿠젠 선수, 독일 대표팀 3회 출장)와 옌스 헤겔러 (헤르타 BSC와 계약 중)는 이 문제를 발견했다.
그 둘은 수비형 미드필더였다. 그들의 커리어에서 그들은 미디어들과 코치들이 그들이 실제 팀에 더하는 가치들은 반영하지 않는 퍼포먼스 도구와 방법들을 사용하는 것에 짜증이 났었다.
NFL에서라면 상대방 공격을 막는 리차드 셔먼과 같은 코너백은 인터셉션, 파괴시키는 플레이, 그리고 태클과 같은 것으로 스타가 될 수 있다. 브루스 보웬과 데니스 로드맨 같이 꽁꽁 틀어막는 수비수들은 그들의 가치를 스틸, 블락 그리고 리바운드로 증명할 수 있다. 축구에서는 골과 어시스트, 그게 다다.
발락처럼 득점하거나 피를로처럼 프리킥을 찰 수 없는 수비형 미드필더들은 축구에서 언성 히어로이다. 그들은 핵심적인 역할을 수행하지만 어떠한 스탯 카테고리에도 등장하지 않는다. 위의 예에서, 비달은 유베의 포그바로부터 볼을 탈취해서 측면의 코망에게 연결한다. 비달의 플레이는 그 골의 핵심적인 역할을 담당했을 뿐 아니라, 위험한 역습도 막았다. 하지만 그 플레이에서 의미 있는 스탯을 얻은 것은 코망과 뮐러 뿐이다.
글쎄, 보통의 스탯들은 그 자체로는 나쁘지 않다. 그리고 정보를 담고 있다. 하지만 그것들은 모두 양에 관한 것이다. 질 보다는. “소유권”은 예를 들어, 외부와 단절된 상태에서는 아무런 의미도 없다.
티아고의 아름다운 스루 볼은 순식간에 벌어진 일이다. 그 패스는 바이언의 소유권 비율에 나쁜 영향을 끼쳤다. 비록 그것이 레반도프스키의 추가골로 이어지긴 했지만 말이다.
“총 슈팅 수” 역시도 큰 의미를 갖지 못한다. 리오넬 메시의 가까운 거리에서의 슈팅도, 헤이코 웨스터만의 35야드 밖에서의 절박한 시도 역시도 하나의 슈팅일 뿐이다.
그리고 “총 코너킥 수”는 각 팀에게 다른 의미를 가진다. 스페인과 바르셀로나와 같은 티키타카 팀들은 종종 크로스를 직접 박스로 올리지 조차 않는 반면, 리버풀과 잉글랜드는 세트 피스에 크게 의존한다.
“패스 성공률” 역시도 당신이 모든 패스의 리스크/보상 시나리오를 평가하지 않는다면 결점이 있다. 2015/16시즌 분데스리가 시즌에서 마츠 후멜스 (85%)는 소크라티스 (88%) 보다 성공률이 낮았다. 그렇다고 후멜스가 두 선수 중 패스를 더 못하는 선수인가?
기대 골 값 (ExpG) 이나 총 슈팅 비율과 같은 보다 발전된 메트릭들이 있으나, 솔직히 평균적인 시청자들에게는 너무 복잡하다.
그리고 내가 보기에 ExpG에도 사실 큰 결점이 있다. 왜냐하면 그 스탯은 필드 위의 특정 지역에서의 슈팅이 득점으로 이어지는 특정한 기회값이 있다고 말하고 있기 때문이다. 글쎄, 축구를 해 본 사람이라면 날씨, 피치 상태, 신체 컨티션이나 당신이 신고 있는 축구화 종류와 같은 것들이 슈팅을 크게 바꿀 수 있다는 것을 알고 있다. 축구에 동일한 상황이라는 것은 없다.
3천만명 이상의 독일인들이 대표팀 경기를 본다는 것을 잊지 말자. 그러므로 설명하기 쉽고 이해하기 쉬운 메트릭이 필요하다. 할머니나 애들도 보기 때문이다.
미국에서 대부분의 관중은 가로채기나 리바운드가 무언지 알고 있다. 하지만 독일에서 ExpG가 무엇인지 아는 사람은 거의 없다. atch too.
Impect의 메트릭은 모든 플레이는 “질"적인 측면에서 평가될 필요가 있다는 데에 기초한다. 팀은 오직 공이 수비수를 지나치도록 움직였을 때(“Gegner überspielt,” 혹은 “패스에 의해 제쳐진 수비수의 숫자”)만이 득점한다. 수비수를 제치는 것은 플레이에 질을 더하며, 더 많은 수비수를 제칠 수록, 더 양질의 플레이이다. 그것은 논란의 여지가 없다.
여기서 새로운 큰 발견은 “상대를 제친 것”이 주관적인 의견을 배제한 채 질적인 면을 평가할 수 있는 객관적인 통계라는 것이다. 당신은 수비수를 제쳤거나 못했거나 둘 중 하나이다.
수비하는 팀은 분명히 그것을 막기 위해 노력하는 것이다. 그러므로 “Überspielt werden” (제쳐진 횟수) 카테고리에 적은 숫자라는 것은 당신의 팀이 수비에 얼마나 좋았는지를 말해주는 것이다.
모든 플레이를 개별적으로 분석해서 질적인 면을 조정한다는 것은 천재적인 생각이다. 이 영상에서 (독일어이지만, 그림 자체가 말을 할 것이다) 당신은 그것이 어떻게 작동하는지에 대한 생각을 얻을 수 있다.
모든 것이 특정 플레이의 전과 후에 당신의 길에 있는 수비수의 숫자에 달려있다. 이 논리는 드리블 이벤트, 턴오버 그리고 인터셉션에도 역시 적용된다. 위의 비달의 경우, 그는 바이언이 매우 취약한 상황에서 볼을 다시 탈취했고 그것은 여섯명의 바이언 팀동료들이 그의 뒤에 있었을 때 인터셉션 하나 보다 더 크게 친다.
총 “패배한 상대”의 숫자를 “패킹 비율 (Packing-Rate)”이라고 부른다.
Impect는 이에 더해 공격에 있어서 수비수를 제치는 것이 수비수가 압박하는 공격수를 제치는 것 보다 값어치 있다고 결정하였다. 경기당 깊은 위치의 수비수가 제쳐진 숫자를 “IMPECT”라고 른다. 회사 이름과 똑같이 말이다.
브라질과 독일의 경기를 다시 한 번 보자. 다만 이번에는 라이나르츠와 헤겔러 시스템의 눈으로 보도록 하자:
패킹 비율은 독일이 브라질 보다 61명의 선수를 더 제쳤다고 보여주고 있다. 독일이 15% 높은 결과이지만 여전히 그것은 7:1이라는 충격적인 결과를 설명해주지 못한다. Impect 숫자들은 보다 결정적이다. 독일 대표팀이 브라질 대표팀 보다 훨씬 더 수비수를 제치는 것에서 나았다.
영상을 5:35초에 멈춰보면 브라질 선수들이 크로스와 뮐러 사이에 서 있는 것을 볼 수 있다. 센터백들인 단테와 다비드 루이즈를 꽤 쉽게 식별할 수 있을 것이다.
패스가 상대 센터백 뒤로 연결될 때, 그것은 거의 매번 아주 위험한 장면을 만들어낸다. 센터백은 수비의 마지막 라인이고 그들을 지나치는 것은 “머니 플레이”이다.
심지어 예전 메트릭들에 의해서도, 뮐러는 여기서 “패스 성공”을 획득한다. 크로스의 아름다운 공은 “성공한 패스 한번”으로 나타날 것이다. 클로제는 모든 영광을 차지하겠지만, 뮐러와 크로스는 그 스탯 키퍼로는 그렇게 큰 사랑을 받지는 못한다.
예전 메트릭들은 잘 작동하지 않는다는 것을 볼 수 있다; 대신, Impect가 이 특정 플레이의 진짜 이야기를 말해준다.
Impect의 메트릭들은 클로제가 가까운 거리에서 골로 연결했다는 것은 신경쓰지 않는다. 그 플레이를 가장 크게 이끌어낸 것은 크로스와 뮐러였다 - 클로제는 그저 그것을 안으로 차 넣었을 뿐이다.
클로제는 뮐러의 패스를 받은 것으로 +1점을 획득한다. 그게 다다. 분데스리가의 어떤 대체하는 레벨의 선수도 그 지점에서는 득점할 수 있다. 하지만 전 세계의 몇 안되는 선수들 만이 토니 크로스가 그 플레이에서 했던 것처럼 자연스럽게 뮐러에게 연결할 수 있을 것이다. 큰 차이이다. 크로스는 뮐러에게 연결한 패스로 “Gegner überspielt”에서 +4점을 획득했으며, TM13(토마스 뮐러) 역시도 그 귀중한 스루 볼을 받음으로 인해 “Überspielen ermöglichen”로 +4점을 얻었다. 뮐러는 클로제에게 줬던 패스로 마르셀루를 플레이 밖으로 내보내 버림으로써 추가로 +1점을 획득했다.
브라질 수비는 “Überspielt werden”의 측면에서 -5점을 획득한다.
그 일련의 플레이에서 MVP는 분명 뮐러이다. 아주 조그만 공간을 발견해서 온사이드 상태로 달려들어갔으며, 크로스에게 패스 길을 제공했으며 (+4점), 그 패스를 컨트롤해서 클로제에게 넘겨줬다 (+1점). 마침내 칭찬을 받을만한 플레이가 무엇인지를 보여주는 스탯이 생겼다.
패킹에서 후멜스와 로이스는 +6점씩을 받는다. 왜냐하면 후멜스의 패스와 로이스의 런은 똑같이 가치있기 때문이다. 그것은 마치 미식 축구의 패스 성공과 같다. 쿼터백과 와이드 리시버는 공히 가치를 인정받고 같은 플레이에서 스탯을 생산한다 (야드, 캐치/패스성공). 후멜스의 패스는 대단했지만, 로이스의 달려가는 방향과 타이밍 역시 대단했다. 만약 후멜스가 패스를 잘못찼거나 로이스가 런의 타이밍을 잘못 잡았다면, 그 플레이는 죽었을 것이다.
이것은 패킹 스탯에 보이지 않는 패스이다. 그것은 예전 방식인 “패스 성공”에 완전히 들어가지만 말이다. Impect는 뒤로가는 패스들이나 어떤 수비수도 제치지 않는 패스들은 무시한다. 그것은 올바른 평가이다. 앞으로 전진하지 않는 패스는 당신을 득점하게 만들지 못한다. 그것에 반론을 제기할 수는 없다. 동시에 분석해야하는 샘플의 사이즈도 줄어들면서, 편집과 데이타 분석을 더욱 빠르게 할 수 있다.
메시의 위대함은 여전히 숫자로 나타낼 수 있다.
이 충격적인 드리블 연속 장면은 메시에게 +4의 패킹 비율을 준다. 이 드리블과 골이 그렇게 위대한 이유는 메시가 득점했을 때도, 여전히 그의 앞에 세 명의 수비수들을 갖고 있었다는 점이다. 패스로도 +4의 패킹을 얻기는 충분히 힘들다. 메시는 오직 그의 발로만 그렇게 했으며 터프한 슈팅을 골로 전환시켰다.
이것은 사실 두 개의 월드 클라스 플레이로 이루어진 전설적인 골이다.
첫번째 플레이: 메시가 공을 받았을 때 그의 길에 7명의 수비수가 있다.
두번째 플레이: 메시가 슈팅을 했을 때, 오직 세 명만 남겨졌다. 메시는 패킹 비율에서 +4점을 획득했다.
하지만, 메시의 초월적인 기술에도 불구하고, 2015/16시즌 Impect의 유럽 리그 MVP는 메시가 아니라 토니 크로스였다.
크로스는 경기 당 85명(!)의 수비수들을 제쳤으며, 평균 수비형 미드필더들은 28 정도이다. 오케이, 크로스가 패스를 잘한다는 것을 알기 위해 정교한 메트릭이 필요하지 않을지도 모른다. 하지만 크로스가 독일 대표팀과 레알 마드리드에 정확히 얼마만큼의 가치를 더하는지를 말해주는 숫자들은 없었다.
이런 스탯들이 누구한테 베팅해야 될지를 말해줄 수 있을까?
아니, 안해 도박사들. 나는 말 그대로 “거기에 베팅하지 않겠어.
지금까지 Impect가 분석해온 샘플 사이즈가 그들의 시스템이 우리가 전에 봐오던 것들 보다 더 정확하다는 것을 증명했지만, 그것은 여전히 결과를 예측할 수는 없다. 그것은 예측해주는 것이라기 보다는 서술해주는 것이다. 우리가 아는 것은 “Gegner überspielt” 통계에서 높은 점수를 기록한 팀은 86%의 확률로 경기에서 패배하지 않는다는 것이다.
하지만 Impect 메트릭은 더 “나은” 플레이를 한 팀은 이기거나 “지지 말았어야” 한다는 것을 말해주는데, 이것은 많은 레벨에서 큰 의미를 가질 수 있다.
패킹 비율 전투에서는 이겼으나 경기에서 패배한 그 나머지 14%의 팀들은 그제야 불운이나 개인적인 실수들에 대해서 지적할 수 있다. 코치들은 그들의 팀이 매주 불운했다는 통계적인 증거를 보여줌으로써 자신들의 자리를 지킬 수 있을지도 모른다. 크로스나 쟈카와 같은 선수들은 언젠가 스트라이커와 같은 큰 돈을 벌 수 있을지도 모른다. 그리고 단장들은 비싼 이적료를 지출하는 데에 도움이 되는 도구를 갖게 된 것인지도 모른다. 왜냐하면 재능 평가가 혁명적으로 바뀔 것이기 때문이다. 선수의 속도와 압도적인 신체 능력은 부상과 나이로 잃을 수 있다. 가치 는 패스를 하는 능력은 그렇게 빨리 사라지지 않는다. 챠비나 피를로에게 물어보라. 그 선수들은 35세 이상의 나이에 챔피언스 리그 결승에서 각각 플레이했고, über 운동 선수들은 그렇게 잘 나이들지 않는다. 이제 클럽들은 재능들이 가치있는 패스를 할 수 있는지 아니면 그가 단순히 그가 상대하는 선수들 보다 빠르거나 강할 뿐인 것인지 알아낼 수 있다.
라이나르츠와 헤겔러가 만들어 낸 스탯은 축구 애널리틱스에서 비약적인 발전이므로, 자연스럽게 수요가 크다.
독일 대표팀, 바이어 04, 보루시아 도르트문트 그리고 RB 라이프치히는 이미 그 기술의 라이센스를 획득했다. 그 고객 리스트는 Impect가 어떤 일에 착수했음을 보여준다. 로거 슈미트, 요아킴 뢰브, 토마스 투헬 그리고 랄프 랑닉은 오늘날 게임의 가장 똑똑하고 가장 혁신적인 코치들이다. 만약 그들 모두가 무언가를 좋아한다면, 그것은 합리적인 것이다.
유로 2016에서 독일의 넘버 원 네트웍인 ARD는 방송에서 패킹 비율을 사용할 것이다. 전 바이언 스타이자 ARD에서 일하고 있는 메멧 숄에 따르면, 그 데이타는 굉장히 빨리 수집되어서 실시간 패킹 숫자도 가능하다고 한다.
그리고 더욱 중요한 것은, 패킹은 쉽게 설명할 수 있고 보통 시청자들에게 무섭게 다가오지도 않는다.
불행히도, 지난 월드컵, 유로 그리고 챔피언스 리그 경기들을 재평가할 계획이 있는지는 알려지지 않았다. 우리는 또한 언젠가 대중에게 데이타베이스가 오픈될 것인지 아니면 이 기술은 계속 닫혀 있을지도 알지 못한다.
내가 아는 것은 Impect 스탯은 인터넷에서 열광하는 기대 골 값과 같은 메트릭과 결합될 수 있다는 것이다. 이것은 각 포지션이나 선수들에게 맞춤될 수 있어서 더 나은 숫자들을 생산할 것이다.
람이냐 말디니냐? 호날두냐 메시냐? 지단이나 넷처냐? 루이스 수아레즈냐 클리스만이냐?
많은 역사적인 “누가 더 낳냐?” 논쟁들은 잘 정리 될 수 있다.
그리고 당신이 만약 “스탯은 너드들의 것”이라는 전통주의자라면 걱정마라!
도르트문트와 리버풀 전 (3:4)과 같은 경기는 여전히 일어날 수 있으며 가장 진보된 예측 모델과 알고리즘도 틀렸음을 증명될 것이다. 하지만 스프레드시트로 축구를 보는 이들이라면, Impect의 새로운 숫자들은 계시이다.
내가 걱정하는 한 가지는 진보된 메트릭이 정말 사용되기 시작한다면, 레알이나 바이언과 같은 클럽들이 도르트문트나 비야레알에서 최고의 애널리스트들과 기술자들은 모조리 데려갈 것이라는 것이다. 불행히도 “정보 전쟁”은 돈으로 이길 수 있다.