Con un algoritmo se pueden descifrar las estrategias de los mejores equipos de fútbol
Entre bloggers conocemos la teoría que utiliza o utilizó Google y otros motores de búsqueda para determinar que sitios eran relevantes y cuales no, el famoso PageRank. Para los que no conocen que función cumple, se los voy a explicar de manera sencilla y sin darle vueltas:
Es un algoritmo que según la cantidad de sitios que te enlazan, es decir, que se conectan con vos desde distintos puntos en la red, determina que tan importante sos. Estos “conectores”, también conocidos como nodos, son analizados y según la importancia que ellos tengan, es el PageRank en el cual los buscadores te posicionan, por ende, a mayor PageRank, más importante es tu sitio para el buscador y a su vez ayudas a otros sitios al enlazarlos.
Usando la teoría del PageRank para analizar el fútbol
Es muy interesante lo que se está descubriendo, justamente lo que dice el título, y gracias al entendimiento del PageRank, ahora también se puede entender a equipos de fútbol y a sus jugadores, para poder así modificar o crear estrategias que logren la victoria.
El domingo pasado muchos internautas seguimos la final de los campeonatos de la Eurocopa 2012, donde España demolió a un cansado equipo italiano por 4 a 0. Logrando así la tercera gran victoria de España, y asentándose como el mejor equipo del mundo.
Entonces, ¿qué hace que España sea tan bueno? Los aficionados, expertos y periodistas deportivos siempre intentaron descifrar la estrategia de España, con respecto a la precisión en sus pases, conocido por algunos como el estilo “tiki-taka”. Es fácil de detectar y muy agradable para ver, pero es mucho más difícil de describir y definir.
Según parece, esto va a cambiar. Hoy en día, Javier López Peña en el University College de Londres y Hugo Touchette en el Queen Mary University de Londres revelan una nueva forma de analizar y caracterizar el desempeño de los equipos de fútbol y los jugadores.
Ellos dicen que su enfoque produce una representación cuantificable del estilo de un equipo, identifica a las personas clave y pone a la vista todas las debilidades potenciales.
Su idea es pensar en cada jugador como un nodo en una red y pasar cada uno como un borde que conecta los nodos, es decir, como un enlace comentado anteriormente. A continuación, distribuir los nodos de una manera que refleje la posición de juego de cada jugador en el terreno de juego.
La imagen superior muestra las redes resultantes de los Países Bajos (izquierda) y España utilizando los datos de los octavos de final de la Copa del Mundo 2010 en Sudáfrica. Estos equipos jugaban la final que España ganó.
Una inspección visual de estas redes de inmediato revela algunas ideas interesantes en el partido. El grosor de las flechas representa el número de pasadas entre los nodos y es inmediatamente evidente que el equipo español controla muy bien esa técnica. Esta imagen capta 417 pases por el equipo español en comparación con 266 para los Países Bajos.
Los principales actores también se destacan por el número de pases que hacen y reciben, como por ejemplo 16 (Sergio Busquets) y 8 (Xavi).
Sin embargo, esta representación también permite un análisis mucho más sofisticado que utiliza las herramientas estándar de la ciencia en la red.
Por ejemplo, la proximidad central mide lo fácil que es llegar a un nodo en la red. En términos futbolísticos, mide qué tan bien conectado está un jugador con el resto del equipo.
Busquets y Xavi tienen los puntajes más altos en el equipo español. Ambos están mejor conectados que el mejor jugador conectado holandés, 1 (Steckelenberg) el portero. Que el portero fue el mejor jugador de Holanda, eso ya lo dice todo.
Otra idea es la centralidad de intermediación, que mide el grado en que un nodo se encuentra en el camino a otros nodos. En términos futbolísticos, la centralidad de intermediación mide el flujo de pelota entre los jugadores, lo cual depende de otros jugadores. Entonces, claro está, que los jugadores con una alta centralidad de intermediación son cruciales para mantener el impulso del juego en marcha.
Algo interesante que podemos analizar de lo anterior, puede ser el gran impacto que puede sufrir la estructura de la red, es decir, la estructura del equipo, si un solo jugador con una alta centralidad de intermediación es vulnerable a una lesión, o una tarjeta roja.
El número 11 de España Joan Capdevila es el jugador con la más alta centralidad de intermediación en este partido. Él es claramente un objetivo para los pases de muchos jugadores, ya que a su vez, alimenta al número 14 y luego de ahí surge el pase a Xavi (8).
Luego está el famoso algoritmo PageRank del cual veníamos hablando, que mide la popularidad de un jugador, a juzgar por el número de pases que recibe de otros reproductores populares. Se da una idea aproximada de quién va a terminar con la pelota después de un número suficientemente de pases. Sin lugar a dudas, en el juego analizado es Xavi.
Es evidente que existen limitaciones a este enfoque. Los datos son un promedio de varios juegos por lo que no se logra captar la dinámica de juegos específicos. Y las posiciones de los nodos son también una generalización amplia.
Como mejorarlo:
- Añadir otro nodo para representar la meta de los opositores, registrando el número de remates.
- Añadir algo similar a lo anterior para medir la precisión de los pases.
- Añadir el seguimiento de las intercepciones para determinar la fortaleza defensiva.
- Añadir un modo para recopilar y analizar los datos en tiempo real.
En términos de análisis de datos, en el fútbol nunca se pudo lograr como en otros deportes en los que si se llega a una aproximación e inclusive se escribieron películas al respecto, como es el caso de MoneyBall, referida al béisbol.
¿Será esta teoría del PageRank aplicada al fútbol el primer paso? ¿Podremos hacerle competencia a los grandes equipos del mundo a través de estrategias basadas en cálculos matemáticos? ¿Armaremos la mejor estrategia de fútbol gracias a algoritmos como el descrito?
Lo ví en Technology Review
