Comparte:
Big data
20 de julio de 2018

Rusia 2018: el Mundial de los modelos predictivos que fallaron

Rusia 2018: el Mundial de los modelos predictivos que fallaron

Rusia 2018: el Mundial de los modelos predictivos que fallaron

Escrito por , 20/07/2018

Para entender por qué Rusia 2018 ha sido el Mundial de los modelos predictivos, comenzaré por decir que el fútbol no es solo un deporte, sino un gran negocio. Según datos de Deloitte en la temporada de 2015/16, el fútbol europeo tenía un tamaño de mercado de 24.600 millones de euros y en el Reino Unido, la Premier League generó un negocio de 5.400 millones de euros el año pasado… Por eso no es de extrañar que los diferentes actores involucrados (sociedades deportivas, gobiernos, medios de comunicación…) hagan fuertes inversiones en tecnología, tanto para mejorar aspectos del juego como para optimizar la experiencia de los espectadores, en cuya afición, en definitiva, se basa el negocio. En esto el fútbol no es ajeno a la revolución digital.

Hemos visto algunos ejemplos: el VAR (videoarbitraje), la tecnología Goal line (para evitar goles-fantasma), radioenlaces entre árbitro y asistentes y otras. Pero también novedosas aplicaciones para cálculos estadísticos que mejoran la perspectiva de los profesionales y espectadores (kilómetros recorridos por un jugador en el campo, su velocidad máxima, las zonas del terreno de juego más transitadas). En este contexto es muy tentador aplicar al fútbol las nuevas tecnologías de analytics y modelos predictivos. En los días previos al pasado Mundial de Rusia vimos distintas publicaciones que intentaban predecir los resultados a partir del desarrollo de estos modelos, basados en diferentes técnicas y fuentes.

Puede parecer una frivolidad pero, como en otros negocios, resulta muy útil intentar predecir los resultados. Pensemos en primer lugar en los dirigentes federativos y los entrenadores. Resulta lógico intentar manejar expectativas, preparar a los jugadores y planificar los entrenamientos en función de los posibles rivales. Pero también es importante de cara a otros actores secundarios. Las casas de apuestas deportivas tienen que medir su exposición al riesgo. Y lo mismo ocurre con agentes y compañías que aseguran el “valor de mercado” de los jugadores. Hasta a los gobiernos les interesa predecir el resultado, que influye indudablemente en la “marca país”, los flujos turísticos y el clima social. El Mundial 2018 también ha sido el Mundial de los modelos predictivos. Dado su actual auge era la mejor oportunidad para demostrar su evolución y eficacia.

Se lanzaron a ello empresas e instituciones de varios países pero, ¿cuál fue el resultado de este “mundial paralelo”? En Alemania, El Commerzbank confió su modelo al economista Peter Dixon, que desarrolló un modelo estocástico. Los expertos de Commerzbank analizaron datos deportivos históricos durante años, incluido el sesgo local y el número de goles anotados en Copas Mundiales anterioress. Para dar cuenta de la aleatoriedad inherente al deporte, Commerzbank ejecutó diez mil simulaciones en cada juego. “En un mundo racional Brasil o Alemania deberían ganar”, declaró Dixon. En el ámbito académico el equipo de Andreas Groll, de la Universidad Técnica de Dortmund, con la colaboración de instituciones en Munich y Gante, combinó estadística convencional con machine learning en un método llamado random-forest approach (enfoque de bosque aleatorio), una técnica para analizar grandes cantidades de datos a través de la medición de múltiples parámetros en diferentes ramas. La simulación se llevó a cabo cien mil veces. Con este método, Groll pronosticó: primer puesto para España (17,8 por ciento), seguida de Alemania (17,1 por ciento) y Brasil (12,3 por ciento).

En Argentina, en el Instituto del Cálculo de la Universidad de Buenos Aires, Guillermo Durán y su equipo desarrollaron la plataforma 301060, basada en calcular una “fuerza de ataque” y una “fuerza de defensa” para cada equipo, que contemplaba muchos factores y daba distinto peso a los partidos, a la importancia de la competencia y a la localía pero no a las alineaciones. Con este otro método, el resultado no varió demasiado: en primer lugar Brasil (20,3 por ciento), después España (15,4 por ciento), Alemania (12,4 por ciento) y Argentina (8,8 por ciento).

En Estados Unidos, Microsoft, a través de Bing, realizó predicciones a partir de los resultados históricos de los equipos (victorias y derrotas, margen de victoria, condiciones meteorológicas…), además de incorporar el conocimiento de la actividad web y social (el “conocimiento de las masas”) para definir y mejorar las predicciones. El buscador tuvo en cuenta la percepción de los usuarios y su entendimiento del mundo que los rodea. El resultado: Brasil (16,6 por ciento), Alemania (12,8 por ciento) y España (12,5 por ciento). El banco de inversión Goldman Sachs, por su parte, utilizó el aprendizaje automático para ejecutar 200.000 modelos, a partir de la extracción de datos sobre los atributos del equipo y de los jugadores, para ayudar a pronosticar puntuaciones específicas de los partidos. Luego, Goldman simuló un millón de variaciones del torneo para calcular la probabilidad de avance para cada escuadrón, y el podio fue primero Brasil, segundo Alemania y, en tercer lugar, Portugal.

En Suiza, UBS utilizó las aplicaciones econométricas con las que el servicio de análisis decide la colocación de activos de los patrimonios de sus clientes. Como novedad, utilizó, entre otros indicadores, el rating ELO, método matemático ideado por Árpád Éló, que traslada al cálculo estadístico la habilidad relativa de victoria en torneos o campeonatos deportivos (usual en el ajedrez). Su pronóstico fue: Alemania (24 por ciento), Brasil (19,8 por ciento) y España (16,1 por ciento).

En España el diario “El País” utilizó también un método ELO “corregido”, desarrollado por Kiko Llaneras y Borja Andrino. Un ELO “clásico” que tomaba como fuente los resultados de 32.000 partidos de 159 selecciones al que concedió un peso del 50 por ciento en el resultado y dos factores de corrección. Un “ELO de jugadores”, basado en la información disponible de las alineaciones y un “ELO esperado”, basado en los remates y aciertos en los remates de 200 partidos de selecciones disputados en 2017. Para calibrar el resultado usaron una base de datos de 17.000 partidos de selecciones. El pronóstico no sorprende: ganaba Brasil (17,9 por ciento), seguida de Alemania (15,6 por ciento) y España (15,3 por ciento).

No hace falta decir que ninguno acertó: todos los modelos predictivos mencionados fracasaron estrepitosamente. Los que estuvieron más cerca del resultado final pronosticaron un cuarto puesto para Francia y un octavo para Croacia. El motivo es bastante evidente: pronosticar el resultado de un partido de fútbol entre equipos ciertamente competitivos no está a nuestro alcance. Y menos pronosticar el resultado de una serie de partidos. Simplemente, por más que se esfuercen los analistas, hay demasiadas variables incontrolables. No es posible determinar de antemano factores como el estado físico (y anímico) de los 22 (y a veces 30) jugadores, los errores inexplicables de entrenadores y porteros, la influencia del ambiente y la climatología, los fallos arbitrales o las cuestiones organizativas y logísticas (que también influyen).

Por ejemplo, a Alemania el exceso de confianza y la mala forma de algunos jugadores lo convirtió en un equipo estático, predecible. Por no hablar de increíbles fallos de Hummels y Neuer (que, según los antecedentes, habían sido decisivos en Brasil 2014). O que Messi fallase un penalti de Argentina contra Islandia y decayera anímicamente, entre una rebelión interna contra un entrenador desorientado. O la aleatoriedad de España en cuyo caso un error de principiante de Piqué y la inseguridad de De Gea determinaron el partido con Rusia. O Bélgica que, con un entrenador imprevisto, Roberto Martínez, sorprendió tácticamente a Brasil, que se vio perjudicado por la baja forma física y moral de Neymar. O el drama de Edison Cavani, que se lesionó antes del partido decisivo contra Francia, después de haber sido clave para eliminar al Portugal de Cristiano Ronaldo. O el conmovedor esfuerzo de la Croacia de Modric, un equipo sin grandes títulos y con un míster sin antecedentes, que superó tres prórrogas y dos tandas de penaltis, algo que en cualquier modelo predictivo jugaría en contra de sus posibilidades.

La cuestión es que los modelos utilizados son, lógicamente, conservadores. Intentan predecir el futuro, a partir del pasado. Este método resulta muy bueno en entornos estables, con pocas reglas y variables, pero su éxito es imposible en un entorno tan dinámico como un torneo de fútbol. Es una de las lecciones de humildad que hay que aprender del Mundial de la analítica, la inteligencia artificial y los modelos predictivos: estos métodos no sirven para abordar todas las cuestiones. “Nunca podrías vaticinar, por ejemplo, que el gran favorito Colombia iba a recibir una tarjeta roja y un penalti a los cuatro minutos del partido contra Japón y perdería”, reconoció Andreas Groll. También se lamentó de la derrota de Bélgica “por un córner mal defendido”.

En Qatar 2022 habrá ocasión de nuevo para intentarlo…

Imagen de archivo de EFE: En la foto que encabeza este post Alcides Ghiggia marca el segundo gol de Uruguay que derrota a Brasil en la final del Mundial de 1950 en el estadio Maracaná de Rio de Janeiro, en lo que se considera la mayor hazaña de la historia de los mundiales. Ningún modelo predictivo hubiese pronosticado un resultado que rompía toda lógica. Hasta el propio entrenador de Uruguay había pedido a sus jugadores que se defendieran para perder por pocos goles…

Sobre el autor

Víctor Eduardo Deutsch

Víctor Eduardo Deutsch

Tengo veinticinco años de experiencia en gestión de empresas tecnológicas y he trabajado como consultor de grandes empresas en veinte países en Europa y América. Antes que en Telefónica trabajé en KPM Consulting. He sido profesor adjunto de la Universidad de Buenos Aires-UBA, coautor del programa ejecutivo en eProcurement para el Instituto de Empresa (Madrid) en 2003, investigador UBA y coautor de trabajos de inteligencia artificial, así como del Manual de desarrollo Empresario “Líderes del tercer milenio” y autor de numerosos artículos en medios de España y Argentina.
Ver todos sus artículos »