Cómo elegir un bracket ganador de March Madness

En 2019, más de 40 millones de estadounidenses apostaron dinero en brackets de March Madness, según la American Gaming Association. La mayor parte de este dinero se apostó en «bracket pools», que consisten en un grupo de personas que introducen cada una sus predicciones de los partidos del torneo de la NCAA junto con una compra. La quiniela que más se acerque a la realidad gana. Si además se tienen en cuenta las quinielas en las que sólo está en juego el orgullo, el número de participantes es mucho mayor. A pesar de toda esta atención, la mayoría no se da la mejor oportunidad de ganar porque se centra en la pregunta equivocada.

La pregunta correcta

El error nº 3 en los 10 principales errores de la ciencia de datos del doctor John Elder es hacer la pregunta equivocada. Una piedra angular de cualquier proyecto de análisis exitoso comienza con tener el objetivo correcto del proyecto; es decir, apuntar al objetivo correcto. Si usted es como la mayoría de la gente, cuando rellena su paréntesis, se pregunta: «¿Qué creo que es más probable que ocurra?». Esta es la pregunta incorrecta si estás compitiendo en una quiniela porque el objetivo es ganar dinero, NO hacer el bracket más correcto. La pregunta correcta es: «¿Qué bracket me da la mejor oportunidad de ganar $?»¹ Aunque estas preguntas parecen similares, los brackets que producen serán significativamente diferentes.

Si ignoras a tus oponentes y eliges a los equipos con la mejor oportunidad de ganar partidos – reducirás tus posibilidades de ganar dinero. Incluso el equipo más fuerte es poco probable que lo gane todo, e incluso si lo hace, un montón de tus oponentes probablemente los eligieron también. La mejor manera de optimizar tus posibilidades de ganar dinero es elegir un equipo campeón con buenas posibilidades de ganar que no sea popular entre tus oponentes.

Saber cómo están llenando sus brackets otras personas de tu grupo es crucial, porque te ayuda a identificar los equipos que tienen menos probabilidades de ser elegidos. Una forma de ver cómo los demás están rellenando sus brackets es a través de la página de ESPN «Who Picked Whom» (Figura 1). Resume la frecuencia con la que se elige a cada equipo para avanzar en cada ronda en todos los brackets de ESPN y es un gran primer paso para identificar a los equipos que se pasan por alto.

Figura 1. Página del Desafío del Torneo Quién eligió a Quién

Para que un equipo sea pasado por alto, su probabilidad percibida de ganar debe ser menor que su probabilidad real de ganar. La página Who Picked Whom proporciona una estimación de la probabilidad percibida de ganar, pero para encontrar equipos infravalorados también necesitamos estimaciones de la probabilidad real de ganar. Esto puede variar desde un complejo modelo de predicción hasta tu propia intuición. Dos fuentes en las que confío son las predicciones de March Madness de 538 y las probabilidades de apuestas futuras de Las Vegas. Las predicciones de 538 se basan en una combinación de clasificaciones informáticas y han predicho bien el rendimiento en torneos anteriores. También hay razones para prestar atención a las probabilidades de Las Vegas, porque si se alejaran demasiado, los sportsbooks perderían dinero.

Sin embargo, ambas fuentes tienen sus defectos. 538 se basa en clasificaciones informáticas, por lo que, aunque evitan el sesgo humano, se pierden la intuición de los expertos. La mayoría de las casas de apuestas deportivas de Las Vegas probablemente utilizan tanto las calificaciones informáticas como la intuición de los expertos para crear sus probabilidades de apuestas, pero están fuertemente motivadas para tener apuestas iguales en todos los lados, por lo que se ven significativamente afectadas por la percepción humana. Por ejemplo, si todo el mundo apostara por Duke para ganar el torneo de la NCAA, aumentarían las probabilidades de apuestas de Duke para que más gente apostara por otros equipos para evitar grandes pérdidas. Al calcular las probabilidades de victoria para este artículo, opté por promediar las predicciones de 538 y de Las Vegas para obtener un equilibrio con el que me sintiera cómodo.

Veamos el año pasado. La Figura 2 compara la probabilidad percibida de un equipo de ganar (basada en el Who Picked Whom de ESPN) con su probabilidad real de ganar (basada en las predicciones promediadas de 538 y Las Vegas) para los principales equipos del Torneo de la NCAA de 2019. (Las probabilidades para los 64 equipos del torneo aparecen en la Tabla 6 del Apéndice.)

Figura 2. Posibilidades reales frente a las percibidas de ganar el March Madness para los 8 mejores equipos

Como se muestra en la Figura 2, los participantes eligieron en exceso a Duke y Carolina del Norte como campeones y en defecto a Gonzaga y Virginia. Muchos factores contribuyeron a estas selecciones; por ejemplo, la mayoría de los modelos de predicción, los ávidos aficionados al deporte y los apostantes coincidieron en que Duke fue el mejor equipo del año pasado. Si se trata de elegir el bracket con mayor probabilidad de que ocurra, entonces seleccionar a Duke como campeón era la elección natural. Pero ignorar las selecciones realizadas por otros en tu quiniela no te ayudará a ganar tu quiniela.

Aunque este gráfico es interesante, ¿cómo podemos convertirlo en conclusiones concretas? Gonzaga y Virginia parecen buenas selecciones, pero ¿qué pasa con el resto de equipos escondidos en esa esquina inferior izquierda? ¿Tiene sentido elegir a equipos como Texas Tech, que tenía un 2,6% de posibilidades de ganarlo todo, y sólo el 0,9% de los brackets lo eligieron? ¿Cuánto perjudica la elección de un favorito sobrevalorado como Duke a tus posibilidades de ganar tu quiniela?

Para responder a estas preguntas, he simulado muchas quinielas y he descubierto que los equipos que ocupan los puestos de Gonzaga y Virginia suelen ser los mejores elegidos, los más infravalorados de los cuatro o cinco primeros favoritos. Sin embargo, a medida que aumenta el tamaño de tu grupo de brackets, los cabezas de serie inferiores como Texas Tech, tercer cabeza de serie, o Virginia Tech, cuarto cabeza de serie, se vuelven más atractivos. La lógica de esto es simple: la probabilidad de que uno de estos equipos lo gane todo es pequeña, pero si lo hacen, entonces probablemente ganes tu grupo independientemente del número de participantes, porque es probable que nadie más los haya elegido.

Metodología de las simulaciones

Para simular los grupos de brackets, primero tuve que simular brackets. Utilicé un promedio de las predicciones de Las Vegas y 538 para realizar muchas simulaciones de los eventos reales de March Madness. Como ya he comentado, este método no es perfecto, pero es una buena aproximación. A continuación, utilicé la página Quién eligió a quién para simular muchos brackets creados por humanos. Para cada grupo humano, calculé la posibilidad de que ganara un grupo de tamaño n, encontrando primero su posición percentil entre todos los grupos humanos, suponiendo que uno de los 538 grupos simulados de Las Vegas fuera el evento real. Este percentil es básicamente la probabilidad de que sea mejor que un grupo aleatorio. Elevé el percentil a la potencia n-1, y luego repetí para todos los brackets simulados de 538-Vegas, promediando los resultados para obtener una única probabilidad de ganar por bracket.

Por ejemplo, digamos que para una simulación de 538-Vegas, mi bracket está en el percentil 90 de todos los brackets humanos, y hay otras nueve personas en mi pool. La probabilidad de que gane la quiniela sería de 0,99=0,387. Si asumimos una simulación diferente, mi grupo podría estar sólo en el percentil 20, lo que haría que mi probabilidad de ganar fuera de 0,29≈0,0. Al promediar estas probabilidades para todas las simulaciones de 538-Vegas podemos calcular una estimación de la probabilidad de ganar de un bracket en un pool de tamaño n, asumiendo que confiamos en nuestras fuentes de entrada.

Resultados

Utilicé esta metodología para simular pools de brackets con 10, 20, 50, 100 y 1000 participantes. Los resultados detallados de las simulaciones se muestran en las tablas 1-6 del apéndice. Virginia y Gonzaga fueron las mejores elecciones de campeón cuando el grupo tenía 50 o menos participantes. Sin embargo, curiosamente, Texas Tech y Purdue (3 cabezas de serie) y Virginia Tech (4 cabezas de serie) fueron tan buenas o mejores selecciones de campeón cuando el grupo tenía 100 o más participantes.

Las conclusiones de las simulaciones:

  1. Independientemente del tamaño del grupo del bracket, la selección del campeón es más importante para determinar la posibilidad de ganar un grupo del bracket. Las elecciones antes de la Final Four tienen una importancia limitada.
  2. En la mayoría de las quinielas, elegir al más infravalorado de los cuatro o cinco favoritos para ser el campeón le da la mejor oportunidad de ganar.
  3. En las quinielas más grandes, elegir a los equipos infravalorados de menor categoría le da la mejor oportunidad de ganar. Incluso en las quinielas más grandes, hay muchas posibilidades de que esos equipos (aquí, como Virginia Tech) no sean elegidos como campeones por nadie. Aunque sus posibilidades reales de ganarlo todo son pequeñas, si lo hacen, es probable que ganes tu quiniela independientemente del número de participantes.
    1. Pensamientos adicionales

      Hemos asumido que tu quiniela local hace sus selecciones igual que el resto de Estados Unidos, lo que probablemente no sea cierto. Si vives cerca de un equipo que está en el torneo, entonces es probable que ese equipo sea seleccionado en exceso. Por ejemplo, yo vivo en Charlottesville (sede de la Universidad de Virginia), y Virginia ha sido elegida como campeona en aproximadamente el 40% de los grupos de mis quinielas en los últimos dos años. Si vives cerca de un equipo con un alto nivel, una estrategia es empezar con las probabilidades de ESPN de quién eligió a quién, y luego aumentar las probabilidades del equipo local más popular y, en consecuencia, reducir las probabilidades de todos los demás equipos. Otra estrategia que he utilizado es preguntar a la gente de mi quiniela a quién van a elegir. Es mutuamente beneficioso, ya que es menos probable que yo elija a quien ellos están eligiendo.

      Como pensamiento de despedida, quiero describir un escenario del torneo de la NCAA 2019 con el que algunos de ustedes pueden estar familiarizados. Auburn, un quinto cabeza de serie, iba ganando por dos puntos en los últimos momentos del partido, cuando inexplicablemente hicieron una falta al otro equipo en el acto de lanzar un tiro de tres puntos a falta de un segundo. El jugador contrario, un tirador de tiros libres del 78%, fue a la línea y falló dos de tres tiros, permitiendo a Auburn avanzar. Esto no es una realidad alternativa; así es como Auburn ganó su partido de primera ronda contra el 12º cabeza de serie, New Mexico State. A continuación, vencieron a las potencias Kansas, Carolina del Norte y Kentucky en su camino hacia la Final Four, donde se enfrentaron a la misma situación contra Virginia. Kyle Guy, de Virginia, encestó sus tres tiros libres y Virginia ganó el campeonato.

      Añado esto para resaltar un importante calificativo de este análisis: es imposible predecir con exactitud la Locura de Marzo. Fueron genios los que eligieron a Auburn para llegar a la Final Four? Por supuesto que no. Si Terrell Brown, de New Mexico State, hubiera acertado sus tiros libres, habrían parecido tontos. No hay un modelo perfecto que pueda predecir el futuro, y los que lo hacen bien en las quinielas no son gurús del baloncesto, simplemente tienen suerte. Poner en práctica las estrategias de las que se habla aquí no garantiza una victoria; sólo reduce la cantidad de suerte que se necesita para ganar. E incluso con los mejores modelos, seguirá necesitando mucha suerte. Después de todo, es la Locura de Marzo.

      Apéndice: Análisis detallados por tamaño de la quiniela

      En la línea de base (aleatoriamente), una quiniela de diez personas tiene un 10% de posibilidades de ganar. La tabla 1 muestra cómo cambia esa probabilidad en función de la ronda seleccionada para que un determinado equipo pierda. Por ejemplo, los grupos que eligieron que Virginia perdiera en octavos de final ganaron en un grupo de diez personas el 4,2% de las veces, mientras que los grupos que eligieron que lo ganaran todo ganaron el 15,1% de las veces. Como recordatorio, estas simulaciones se hicieron sólo con información previa al torneo -no tenían datos que indicaran que Virginia fuera el eventual campeón, por supuesto-.

      Tabla 1 – Probabilidad de que un bracket gane una quiniela de diez personas dado que tenía un equipo determinado (fila) que llegaba a una ronda determinada (columna) y no llegaba más lejos

      En las quinielas de diez personas, los brackets con mejor rendimiento fueron los que eligieron a Virginia o Gonzaga como campeón, ganando el 15% de las veces. En particular, las selecciones de las primeras rondas no tuvieron una gran influencia en las posibilidades de ganar la quiniela, con la excepción de los grupos en los que un cabeza de serie uno o dos perdió en la primera ronda. Los grupos que tenían un cabeza de serie tres o inferior como campeón tuvieron un rendimiento muy bajo, pero el hecho de que los cabezas de serie inferiores llegaran a la Final Four no tuvo un impacto significativo en la posibilidad de ganar.

      La tabla 2 muestra la misma información para grupos de grupos con 20 personas. La probabilidad de base es ahora del 5%, y de nuevo los brackets con mejor rendimiento son los que eligieron a Virginia o Gonzaga para ganar. Del mismo modo, las elecciones en las primeras rondas no tienen mucha influencia. Michigan State ha pasado a ser la tercera mejor elección de campeón, y curiosamente Purdue es la tercera mejor elección de subcampeón.

      Tabla 2 – Probabilidad de que un bracket gane una quiniela de 20 personas dado que tenía un equipo determinado (fila) que llegaba a una ronda determinada (columna) y no llegaba más lejos

      Cuando el tamaño de la quiniela aumenta a 50, como se muestra en la Tabla 3, elegir a los favoritos sobrevalorados (Duke y Carolina del Norte) como campeones reduce significativamente sus posibilidades de base (2%). Los ligeramente infravalorados dos y tres cabezas de serie ahora aumentan sus posibilidades de base cuando se seleccionan como campeones, pero Virginia y Gonzaga siguen siendo las mejores elecciones.

      Tabla 3 – Probabilidad de que un grupo gane un grupo de 50 personas si un equipo determinado (fila) llega a una ronda determinada (columna) y no llega más lejos

      Con un grupo de 100 personas (Tabla 4), a Virginia y Gonzaga se les unen los infravalorados tres cabezas de serie Texas Tech y Purdue. Elegir a cualquiera de estos cuatro eleva sus posibilidades de base del 1% a cerca del 2%. Elegir a Duke o a Carolina del Norte vuelve a perjudicar tus posibilidades.

      Tabla 4 – Probabilidad de que un grupo de 100 personas gane un bracket dado que tiene un equipo determinado (fila) que llega a una ronda determinada (columna) y no llega más lejos

      Cuando el grupo de brackets crece hasta las 1000 personas (Tabla 5), hay un cambio completo de guardia. Virginia Tech es ahora la elección óptima de campeón, elevando su probabilidad base de ganar su bracket del 0,1% al 0,4%, seguido de los tres cabezas de serie y el sexto clasificado, Iowa State, son las mejores elecciones de campeón.

      Tabla 5 – Probabilidad de que un bracket gane una quiniela de 1000 personas teniendo en cuenta que un equipo determinado (fila) llega a una ronda determinada (columna) y no llega más lejos

      Para referencia, la Tabla 6 muestra la posibilidad real de ganar frente a la posibilidad de ser elegido para ganar para todos los equipos que son séptimos cabezas de serie o mejores. Estas posibilidades se derivan de la página de ESPN Who Picked Whom y de las predicciones de 538-Vegas. Los datos de los ocho primeros equipos de la Tabla 6 se representan en la Figura 2. En particular, Duke y Carolina del Norte están sobrevalorados, mientras que el resto están, al menos, ligeramente infravalorados.

      Los equipos en negrita en la Tabla 6 son ejemplos de equipos que son buenas selecciones de campeones en grupos más grandes. Todos ellos tienen una alta relación entre la posibilidad real de ganar y la posibilidad de ser elegidos para ganar, pero una baja posibilidad real general de ganar.

      Tabla 6 – Probabilidades reales de ganar el campeonato frente a la posibilidad de que el equipo sea elegido para ganar el campeonato. Equipos infravalorados en verde; sobrevalorados en rojo.

      1. Esto requiere estudiar la fórmula de pago. He utilizado la puntuación estándar de la ESPN (320 puntos posibles por ronda) con todo el dinero de la quiniela entregado al ganador. (Se otorgan 10 puntos por cada victoria correcta en la ronda de 64, 20 en la ronda de 32, y así sucesivamente, duplicando hasta que se otorgan 320 por una decisión correcta en el campeonato.)

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *