Computación

En los deportes ya no sirve la intuición, la nueva clave es el 'big data'

Cada vez hay más información sobre la posesión, los movimientos, las trayectorias y otras variables de un partido. Y los científicos luchan por exprimir cada dato para mejorar el rendimiento

por Emerging Technology From The Arxiv | traducido por Teresa Woods
10 Marzo, 2016

El libro, éxito de ventas, Moneyball: The Art of Winning an Unfair Game de Michael Lewis cambió la visión que tenemos del deporte. Especialmente, modificó la forma de valorar a aquellos propietarios, mánagers generales y jugadores con los mayores intereses creados. El libro de Lewis ayudó a desencadenar una revolución en la que el rendimiento de los jugadores se medía y analizaba con un enfoque basado en las pruebas en lugar de una tradición dominada por las anécdotas y la intuición.

Desde entonces, los científicos del deporte han intentado replicar el éxito de este enfoque en deportes como baloncesto, fútbol europeo, fútbol americano y así sucesivamente. Esta ciencia está siendo impulsada por la capacidad de recopilar vastas cantidades de datos acerca de los jugadores y el juego mientras el partido está en curso.

Sin embargo, en muchos de estos deportes, la capacidad de recopilar datos no ha ido de la mano de la capacidad de procesarlos. Así que una pregunta interesante consiste en los retos a los que se enfrenta la ciencia deportiva a la hora de procesar estos datos de forma eficiente. ¿Cuáles son las incógnitas de este novedoso campo en auge?

Hoy recibimos una respuesta gracias al trabajo de Joachim Gudmundsson y Michael Horton de la Universidad de Sídney (Australia), que han analizado este campo y enumerado los retos pendientes a los que se enfrentan los investigadores a la hora de intentar crear una analítica significativa.

Los deportes incluidos en la investigación se conocen en conjunto como deportes de invasión o de cancha compartida. Consisten en dos equipos que compiten por la posesión del balón dentro de un área de juego limitada. Cada equipo dispone del objetivo simultáneo de marcar al colocar el balón dentro de la "portería" del equipo rival y también el de defender la suya propia. Gana el equipo que marque el mayor número de tantos al final del partido.

Los juegos de invasión que comparten esta estructura son el fútbol europeo, el baloncesto, el hockey sobre hielo, el rugby, el fútbol australiano, el fútbol americano y el hockey sobre hierba (lacrosse), por nombrar algunos. Sin embargo, la mayoría de los datos provienen de juegos como el fútbol europeo y el baloncesto profesionales, que disponen de los recursos necesarios para recopilarlos.

Estos datos generalmente incluyen las trayectorias de la pelota y de los jugadores durante el partido, y los registros de eventos que describen acontecimientos como pases, tiros y placajes en momentos determinados. "Los sistemas de rastreo actuales producen unas huellas espacio-temporales de las trayectorias de los jugadores de alta definición y alta frecuencia, y esto, a su vez, ha facilitado una variedad de esfuerzos de investigación, a través de muchas disciplinas, para extraer conocimiento de estas trayectorias", explica Gudmundsson.

El gran reto de la ciencia del deporte consiste en emplear estos datos para adquirir una ventaja competitiva, o en tiempo real durante el transcurso del partido o para ayudar con los entrenamientos, la preparación deportiva o los fichajes. Pero, mientras que los investigadores han logrado unos avances significativos, también existen unas importantes barreras que obstaculizan los progresos.

Una de las más importantes estriba en el dominio que los jugadores mantienen sobre partes del terreno de juego. En la ciencia del deporte, la región dominante de un jugador es la región que él o ella podrá alcanzar antes que cualquier otro jugador. Una manera sencilla de calcularla es trazar un diagrama de Voronoi, que divide el terreno de juego en las regiones más cercanas a cada jugador (ver diagrama superior).

Tal diagrama puede modificarse con la ayuda de otras informaciones, como el hecho de que las regiones dominantes tienden a ser más grandes para el equipo atacante que para el equipo defensor.

Sin embargo, calcular el diagrama de Voronoi para cada jugador sobre la cancha es computacionalmente caro. Nadie lo ha logrado con éxito en tiempo real, ni siquiera para el fútbol de la RoboCopa.

En su lugar, los investigadores calculan una propiedad distinta: la región que cada jugador podría alcanzar en un tiempo determinado. Esto aumenta la velocidad por un factor de 1.000 con un coste de pérdida de precisión de un 10%.

Pero incluso entonces, este enfoque ignora varios factores cruciales. Tal vez el más importante sea que no considera el impulso del jugador. Claramente, un jugador en movimiento podrá dominar una región mayor que uno inmóvil.

Esto puede dar paso a unas complejas subdivisiones del campo. Cuando el jugador A corre hacia un jugador rival B que está inmóvil, cada jugador puede disponer de más de una región dominante, y estas pueden no estar interrelacionadas entre sí. Por ejemplo, el impulso del jugador A proporcionará un mejor acceso a parte, aunque no toda, de la región que se encuentra detrás del jugador B.

Así que un importante problema abierto de la ciencia del deporte consiste en cómo calcular regiones dominantes realistas en tiempo real.

Otro reto relacionado consiste en averiguar si un jugador está libre para recibir un pase. Eso implica determinar si existe una determinada velocidad y dirección a las que la pelota puede pasarse para que un jugador determinado la intercepte antes que cualquier otro.

Esto está claramente relacionado con la región dominante de un jugador. Al disponer de una idea precisa de cuál es esa región, resulta sencillo trazar un pase en línea recta que caiga dentro de la misma. De hecho, así es como funcionan las herramientas actuales que lo hacen.

El problema es que sólo determinadas trayectorias cumplen con el criterio de representar un pase en línea recta. Una trayectoria aérea, por ejemplo, no lo hace. No existe aún ninguna herramienta capaz de lidiar con ello (ni con movimientos más complejos que incluyan el giro de la pelota). Se trata de otro reto sin resolver de la ciencia del deporte.

Después está la manera en la que un jugador puede presionar a otros al cerrar los espacios colindantes. ¿Cómo podrá esto medirse e incorporarse a los modelos?

Un área del análisis deportivo cada vez más importante incluye la ciencia de redes, que trata a cada jugador como un nodo y traza una línea entre ellos cuando el balón viaja entre uno y otro. Esto ha representado un área fructífera de las investigaciones porque un amplio abanico de herramientas matemáticas ya han sido desarrolladas para analizar las redes.

Por ejemplo, resulta sencillo identificar los nodos más importantes de la red al emplear una medición conocida como la centralidad. En el fútbol europeo, los porteros y delanteros tienen la centralidad más baja, mientras que los defensas y centrales tienen la más alta.

El mismo tipo de ciencia también permite que la red sea dividida en agrupaciones, de forma que algunos miembros del equipo podrían limitarse a pasarse el balón entre ellos o trabajar juntos de forma más eficiente.

No obstante, el problema con la ciencia de redes es que existen numerosas maneras de medir la centralidad y determinar las agrupaciones, y no siempre está claro porqué ha de emplearse una frente a otra. Así que otro problema sin resolver consiste en evaluar sistemáticamente y comparar estos métodos para determinar su utilidad y valor.

Otra clase de problemas surge del análisis de los datos de sistema de juego. Por ejemplo, con la lista de trayectorias de jugador y los registros de eventos durante un tramo de un partido, ¿sería posible determinar el sistema de juego– por ejemplo un 4-4-2 en el fútbol europeo – o el tipo de marcaje empleado por la defensa, como una individual o en zona en el baloncesto?

Existen algunas pruebas de que esto se puede conseguir durante parte del tiempo en determinados deportes. Pero igualar o superar el rendimiento humano en esta actividad sigue siendo la meta.

Gudmundsson y Horton describen varios problemas más sin resolver y cómo las ideas desarrolladas en deportes como el fútbol y el baloncesto podrían ser aplicadas de forma útil a otros deportes de invasión como el hockey y el balonmano.

Pero perfeccionar los algoritmos que pueden resolver estos problemas sólo representa la mitad de la batalla. La próxima fase consistirá en preguntar cómo estas herramientas podrían ayudar a mejorar el rendimiento tanto dentro como fuera del terreno de juego. ¿Podrían ser empleadas como una métrica del rendimiento y valor de un jugador? ¿Podrían determinar si un jugador que tiene éxito en un equipo también tendría éxito en otro? Y, ¿podrán funcionar en tiempo real durante el transcurso de un partido para ayudar a los entrenadores y aficionados por igual?

Probablemente se producirán unos avances importantes en los próximos años. Está claro que a los analistas de datos deportivos les espera una época muy emocionante.

Ref: arxiv.org/abs/1602.06994 : Spatio-Temporal Analysis of Team Sports – A Survey

Computación

En los deportes ya no sirve la intuición, la nueva clave es el 'big data'

La 'start-up' de EE UU que se enfrenta al gigante japonés de materiales para chips

ASML, la empresa que revolucionó la fabricación de chips y quiere seguir haciéndolo

‘Chiplets’: el arma de China en su batalla tecnológica contra EE UU