Come scegliere una staffa vincente di March Madness

Nel 2019, oltre 40 milioni di americani hanno scommesso soldi sulle staffe di March Madness, secondo l’American Gaming Association. La maggior parte di questi soldi è stata scommessa in “bracket pools”, che consistono in un gruppo di persone che inseriscono ciascuna le loro previsioni delle partite del torneo NCAA insieme a un buy-in. La staffa che si avvicina di più ad essere giusto vince. Se si considerano anche le piscine staffa dove solo l’orgoglio è in gioco, il numero di partecipanti è molto più grande. Nonostante tutta questa attenzione, la maggior parte non si dà la migliore possibilità di vincere perché si concentra sulla domanda sbagliata.

La domanda giusta

L’errore #3 nella Top 10 Data Science del Dr. John Elder è quello di fare la domanda sbagliata. Una pietra miliare di ogni progetto di analisi di successo inizia con l’avere il giusto obiettivo del progetto; cioè, mirare al giusto obiettivo. Se siete come la maggior parte delle persone, quando compilate la vostra fascia, vi chiedete: “Cosa penso sia più probabile che accada?”. Questa è la domanda sbagliata da fare se state gareggiando in un pool perché l’obiettivo è quello di vincere soldi, NON di fare il bracket più corretto. La domanda corretta da fare è: “Quale staffa mi dà la migliore possibilità di vincere $?”¹ Mentre queste domande sembrano simili, le staffe che producono saranno significativamente diverse.

Se ignorate i vostri avversari e scegliete le squadre con la migliore possibilità di vincere le partite – ridurrete la vostra possibilità di vincere soldi. Anche la squadra più forte è improbabile che vinca tutto, e anche se lo fa, molti dei vostri avversari probabilmente li hanno scelti. Il modo migliore per ottimizzare le vostre possibilità di fare soldi è quello di scegliere una squadra campione con una buona possibilità di vincere che è impopolare con i vostri avversari.

Sapere come le altre persone nella vostra piscina stanno riempiendo i loro bracket è fondamentale, perché vi aiuta a identificare le squadre che hanno meno probabilità di essere scelte. Un modo per vedere come gli altri stanno compilando i loro bracket è tramite la pagina Who Picked Whom di ESPN (Figura 1). Riassume la frequenza con cui ogni squadra viene scelta per avanzare in ogni turno in tutte le fasce di ESPN ed è un ottimo primo passo per identificare le squadre trascurate.

Figura 1. La pagina Who Picked Whom Tournament Challenge di ESPN

Perché una squadra sia trascurata, la sua possibilità percepita di vincere deve essere inferiore a quella reale. La pagina Who Picked Whom fornisce una stima della probabilità percepita di vincere, ma per trovare le squadre sottovalutate abbiamo bisogno anche di stime per la probabilità effettiva di vincere. Questo può variare da un complesso modello di previsione al vostro istinto. Due fonti di cui mi fido sono i pronostici di March Madness di 538 e le quote delle scommesse future di Vegas. Le previsioni di 538 sono basate su una combinazione di classifiche di computer e hanno previsto bene le prestazioni nei tornei passati. C’è anche motivo di prestare attenzione alle quote di Vegas, perché se fossero troppo lontane, le scommesse sportive perderebbero soldi.

Tuttavia, entrambe le fonti hanno i loro difetti. 538 si basa sulle valutazioni del computer, quindi mentre evitano i pregiudizi umani, perdono l’intuizione degli esperti. La maggior parte delle scommesse sportive di Las Vegas probabilmente usa sia le valutazioni del computer che l’intuizione degli esperti per creare le loro quote di scommessa, ma sono fortemente motivate ad avere scommesse uguali su tutti i lati, quindi sono significativamente influenzate dalla percezione umana. Per esempio, se tutti scommettessero su Duke per vincere il torneo NCAA, aumenterebbero le probabilità di scommessa di Duke in modo che più persone scommettano su altre squadre per evitare grandi perdite. Quando ho calcolato le probabilità di vittoria per questo articolo, ho scelto di fare una media tra 538 e i pronostici di Vegas per ottenere un equilibrio con cui mi sentivo a mio agio.

Guardiamo l’anno scorso. La figura 2 confronta la probabilità percepita di una squadra di vincere (basata sul Who Picked Whom di ESPN) con la loro effettiva possibilità di vincere (basata sulla media dei pronostici 538-Vegas) per le principali squadre del Torneo NCAA 2019. (Le probabilità per tutte le 64 squadre del torneo appaiono nella Tabella 6 in Appendice.)

Figura 2. Possibilità effettive rispetto a quelle percepite di vincere la March Madness per 8 top team

Come mostrato nella Figura 2, i partecipanti hanno scelto in eccesso Duke e North Carolina come campioni e in difetto Gonzaga e Virginia. Molti fattori hanno contribuito a queste selezioni; per esempio, la maggior parte dei modelli predittivi, gli appassionati di sport e gli scommettitori erano d’accordo sul fatto che Duke fosse la migliore squadra l’anno scorso. Se si stava scegliendo la staffa che era più probabile che si verificasse, quindi selezionando Duke come campione era la scelta naturale. Ma ignorare le selezioni fatte da altri nel vostro gruppo non vi aiuterà a vincere il vostro gruppo.

Mentre questo grafico è interessante, come possiamo trasformarlo in risultati concreti? Gonzaga e Virginia sembrano buone scelte, ma che dire del resto delle squadre nascoste nell’angolo in basso a sinistra? Ha mai senso scegliere squadre come Texas Tech, che aveva il 2,6% di possibilità di vincere tutto, e solo lo 0,9% delle parentesi li ha scelti? Quanto la scelta di un favorito sopravvalutato come Duke danneggia le vostre possibilità di vincere la vostra piscina?

Per rispondere a queste domande, ho simulato molte piscine di staffe e ho scoperto che le squadre nei posti di Gonzaga e Virginia sono di solito le migliori scelte, le più sottovalutate tra le prime quattro o cinque favorite. Tuttavia, con l’aumentare delle dimensioni del vostro pool di bracket, i semi inferiori trascurati come la terza classificata Texas Tech o la quarta classificata Virginia Tech diventano più attraenti. La logica di questo è semplice: la possibilità che una di queste squadre vinca tutto è piccola, ma se lo fa, allora probabilmente vincerete il vostro gruppo indipendentemente dal numero di partecipanti, perché è probabile che nessun altro le abbia scelte.

Metodologia delle simulazioni

Per simulare i gruppi di staffe, ho dovuto prima simulare le staffe. Ho usato una media delle previsioni di Vegas e 538 per eseguire molte simulazioni degli eventi reali di March Madness. Come discusso sopra, questo metodo non è perfetto ma è una buona approssimazione. Poi, ho usato la pagina Who Picked Whom per simulare molte fasce create dall’uomo. Per ogni staffa umana, ho calcolato la possibilità che avrebbe vinto un pool di dimensioni n trovando prima il suo percentile tra tutte le staffe umane assumendo che una delle 538 staffe simulate di Las Vegas fosse l’evento reale. Questo percentile è fondamentalmente la possibilità che sia migliore di una staffa casuale. Ho aumentato il percentile alla potenza n-1, e poi ho ripetuto per tutte le staffe simulate di 538-Vegas, facendo la media dei risultati per ottenere una singola probabilità di vittoria per staffa.

Per esempio, diciamo che per una simulazione di 538-Vegas, la mia staffa è nel 90° percentile di tutte le staffe umane, e ci sono altre nove persone nel mio gruppo. La possibilità che io vinca la scommessa sarebbe 0,99=0,387. Se assumiamo una simulazione diversa, allora la mia fascia potrebbe essere solo nel 20° percentile, il che renderebbe la mia probabilità di vittoria 0,29≈0,0. Facendo la media di queste probabilità per tutte le 538 simulazioni di Las Vegas possiamo calcolare una stima della probabilità di vittoria di un bracket in un pool di dimensioni n, assumendo che ci fidiamo delle nostre fonti di input.

Risultati

Ho usato questa metodologia per simulare pool di bracket con 10, 20, 50, 100, e 1000 partecipanti. I risultati dettagliati delle simulazioni sono mostrati nelle tabelle 1-6 nell’appendice. Virginia e Gonzaga sono stati i migliori campioni quando il gruppo aveva 50 o meno partecipanti. Tuttavia, è interessante notare che Texas Tech e Purdue (3-seed) e Virginia Tech (4-seed) erano altrettanto buone o migliori quando il gruppo aveva 100 o più partecipanti.

Takeaways dalle simulazioni:

  1. A prescindere dalle dimensioni del gruppo, la scelta del campione è più importante nel determinare la possibilità di vincere un gruppo. Le scelte prima delle Final Four hanno un’importanza limitata.
  2. Nella maggior parte dei pool, scegliere la più sottovalutata tra le prime quattro o cinque favorite per essere il campione ti dà la migliore possibilità di vincere.
  3. Nei pool di bracket più grandi, scegliere le squadre sottovalutate con un punteggio inferiore ti dà la migliore possibilità di vincere. Anche in pool molto grandi, c’è una buona probabilità che tali squadre (qui, come Virginia Tech) non saranno scelte come campioni da nessuno. Anche se la loro effettiva possibilità di vincere tutto è piccola, se lo fanno, probabilmente vincerete il vostro pool indipendentemente dal numero di partecipanti.

Pensieri aggiuntivi

Abbiamo assunto che il vostro pool locale faccia le sue selezioni proprio come il resto dell’America, il che probabilmente non è vero. Se vivete vicino a una squadra che è nel torneo, allora quella squadra sarà probabilmente sovraselezionata. Per esempio, io vivo a Charlottesville (sede dell’Università della Virginia), e Virginia è stata scelta come campione in circa il 40% delle staffe nelle mie piscine negli ultimi due anni. Se vivete vicino a una squadra con una testa di serie alta, una strategia è quella di iniziare con le quote di ESPN Who Picked Whom, e poi aumentare le quote della popolare squadra locale e corrispondentemente diminuire le quote di tutte le altre squadre. Un’altra strategia che ho usato è quella di chiedere alle persone nella mia piscina chi stanno scegliendo. È reciprocamente vantaggioso, poiché è meno probabile che io scelga chi stanno scegliendo loro.

Come pensiero conclusivo, voglio descrivere uno scenario del torneo NCAA 2019 che alcuni di voi potrebbero conoscere. Auburn, una quinta testa di serie, stava vincendo di due punti nei momenti finali della partita, quando inspiegabilmente ha commesso un fallo sull’altra squadra nell’atto di tirare un tiro da tre punti a un secondo dalla fine. Il giocatore avversario, un tiratore di tiri liberi del 78%, è andato sulla linea e ha mancato due dei tre tiri, permettendo ad Auburn di avanzare. Questa non è una realtà alternativa; questo è il modo in cui Auburn ha vinto la sua partita di primo turno contro la dodicesima classificata New Mexico State. Hanno continuato a battere le potenze Kansas, North Carolina e Kentucky sulla loro strada verso le Final Four, dove hanno affrontato la stessa identica situazione contro Virginia. Kyle Guy di Virginia ha fatto tutti e tre i suoi tiri liberi, e Virginia ha vinto il campionato.

Lo aggiungo per evidenziare un importante qualificatore di questa analisi: è impossibile prevedere accuratamente la March Madness. Le persone che hanno scelto Auburn per andare alle Final Four erano dei geni? Naturalmente no. Se Terrell Brown di New Mexico State avesse fatto i suoi tiri liberi, sarebbero sembrati sciocchi. Non esiste un modello perfetto che possa predire il futuro, e quelli che fanno bene nelle piscine non sono guru del basket, sono solo fortunati. Attuare le strategie di cui si è parlato qui non garantisce una vittoria, ma riduce solo la quantità di fortuna necessaria per vincere. E anche con i migliori modelli, avrete comunque bisogno di molta fortuna. È March Madness, dopo tutto.

Appendice: Analisi dettagliate per dimensioni del pool

Al baseline (in modo casuale), una staffa in un pool di dieci persone ha il 10% di possibilità di vincere. La tabella 1 mostra come questa probabilità cambia in base al turno selezionato per la perdita di una data squadra. Per esempio, le staffe che avevano Virginia che perdeva negli ottavi di finale hanno vinto il 4,2% delle volte, mentre le staffe che le hanno scelte per vincere tutto hanno vinto il 15,1% delle volte. Come promemoria, queste simulazioni sono state fatte solo con informazioni pre-torneo – non avevano dati che indicassero che Virginia fosse il campione finale, ovviamente.

Tabella 1 – Probabilità che un bracket vinca un pool di dieci persone dato che aveva una data squadra (riga) che arrivava a un dato turno (colonna) e non oltre

Nei pool di dieci persone, i bracket con le migliori prestazioni sono stati quelli che hanno scelto Virginia o Gonzaga come campione, vincendo il 15% delle volte. In particolare, le scelte del primo turno non hanno avuto una grande influenza sulla possibilità di vincere il gruppo, con l’eccezione delle squadre che avevano una o due teste di serie che perdevano al primo turno. Le squadre che avevano una testa di serie tre o inferiore come campione hanno ottenuto risultati molto scarsi, ma il fatto che le teste di serie inferiori arrivassero alle Final Four non ha avuto un impatto significativo sulla possibilità di vincere.

La tabella 2 mostra le stesse informazioni per i gruppi di squadre con 20 persone. La probabilità di base è ora del 5%, e ancora una volta le migliori staffe sono quelle che hanno scelto Virginia o Gonzaga per vincere. Allo stesso modo, le scelte nei primi turni non hanno molta influenza. Michigan State è ora salito al terzo posto tra le migliori scelte per il campione, e, curiosamente, Purdue è la terza migliore scelta per il secondo turno.

Tabella 2 – Probabilità che un bracket vinca un pool di 20 persone dato che aveva una data squadra (riga) che arrivava a un dato turno (colonna) e non oltre

Quando la dimensione del bracket pool aumenta a 50, come mostrato nella tabella 3, scegliere i favoriti sopravvalutati (Duke e North Carolina) come campioni abbassa significativamente le possibilità di base (2%). Le semi due e tre leggermente sottovalutate ora aumentano le vostre possibilità di base quando vengono scelte come campioni, ma Virginia e Gonzaga rimangono le migliori scelte.

Tabella 3 – Probabilità che un bracket vinca un pool di 50 persone dato che ha una data squadra (riga) che arriva a un dato turno (colonna) e non va oltre

Con un bracket pool di 100 persone (Tabella 4), Virginia e Gonzaga sono affiancate dalle sottovalutate tre semi Texas Tech e Purdue. Scegliere uno di questi quattro aumenta le vostre possibilità di base dall’1% a quasi il 2%. Scegliere Duke o North Carolina nuoce di nuovo alle vostre possibilità.

Tabella 4 – Probabilità che un bracket vinca un pool di 100 persone dato che ha una data squadra (riga) che arriva a un dato turno (colonna) e non va oltre

Quando il pool di bracket cresce a 1000 persone (Tabella 5), c’è un completo cambio della guardia. Virginia Tech è ora la scelta ottimale per il campione, aumentando la vostra probabilità di vincere il vostro gruppo dallo 0,1% allo 0,4%, seguita dalle tre squadre e dalla sesta classificata Iowa State sono le migliori scelte per il campione.

Tabella 5 – Probabilità che un bracket vinca un pool di 1000 persone dato che ha una data squadra (riga) che arriva a un dato turno (colonna) e non va oltre

Per riferimento, la Tabella 6 mostra la possibilità effettiva di vincere rispetto alla possibilità di essere scelti per vincere per tutte le squadre classificate settime o superiori. Queste probabilità sono derivate dalla pagina ESPN Who Picked Whom e dai pronostici di 538-Vegas. I dati per le prime otto squadre della tabella 6 sono tracciati nella figura 2. In particolare, Duke e North Carolina sono sopravvalutate, mentre le altre sono tutte almeno leggermente sottovalutate.

Le squadre in grassetto nella tabella 6 sono esempi di squadre che sono buoni campioni in piscine più grandi. Hanno tutte un alto rapporto tra la possibilità effettiva di vincere e la possibilità di essere scelte per vincere, ma una bassa possibilità effettiva complessiva di vincere.

Tabella 6 – Probabilità effettive di vincere il campionato vs probabilità che la squadra sia scelta per vincere il campionato. Squadre sottovalutate in verde; sopravvalutate in rosso.

  1. Questo richiede lo studio della formula del payout. Ho usato il punteggio standard di ESPN (320 punti possibili per round) con tutti i soldi della piscina dati al vincitore. (Vengono assegnati 10 punti per ogni vittoria corretta nel round dei 64, 20 nel round dei 32, e così via, raddoppiando fino a 320 per una chiamata corretta al campionato.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *