En 2019, plus de 40 millions d’Américains ont parié de l’argent sur les brackets de March Madness, selon l’American Gaming Association. La plupart de cet argent a été parié dans des « bracket pools », qui consistent en un groupe de personnes entrant chacune leurs prédictions sur les matchs du tournoi NCAA, ainsi qu’un buy-in. Le bracket qui s’approche le plus de la vérité gagne. Si l’on considère également les bracket pools où seule la fierté est en jeu, le nombre de participants est beaucoup plus important. Malgré toute cette attention, la plupart ne se donnent pas les meilleures chances de gagner parce qu’ils se concentrent sur la mauvaise question.
La bonne question
L’erreur n°3 du Top 10 des erreurs de la science des données du Dr John Elder est de poser la mauvaise question. La pierre angulaire de tout projet analytique réussi commence par avoir le bon objectif de projet, c’est-à-dire viser la bonne cible. Si vous êtes comme la plupart des gens, lorsque vous remplissez votre fourchette, vous vous demandez : « Que pensez-vous qu’il soit le plus probable qu’il se passe ? » C’est la mauvaise question à se poser si vous participez à une cagnotte, car l’objectif est de gagner de l’argent, PAS de faire le bracket le plus correct. La bonne question à se poser est la suivante : » Quel bracket me donne la meilleure chance de gagner $ ? « ¹ Bien que ces questions semblent similaires, les brackets qu’elles produisent seront significativement différents.
Si vous ignorez vos adversaires et choisissez les équipes ayant la meilleure chance de gagner des matchs – vous réduirez vos chances de gagner de l’argent. Même l’équipe la plus forte a peu de chances de tout gagner, et même si elle le fait, une grande partie de vos adversaires l’ont probablement choisie aussi. La meilleure façon d’optimiser vos chances de gagner de l’argent est de choisir une équipe championne qui a de bonnes chances de gagner et qui est impopulaire auprès de vos adversaires.
Savoir comment les autres personnes de votre pool remplissent leurs brackets est crucial, car cela vous aide à identifier les équipes qui sont moins susceptibles d’être choisies. Une façon de voir comment les autres remplissent leurs brackets est via la page Who Picked Whom d’ESPN (figure 1). Elle résume la fréquence à laquelle chaque équipe est choisie pour passer à chaque tour dans tous les brackets ESPN et constitue une excellente première étape pour identifier les équipes négligées.
Figure 1. La page Who Picked Whom Tournament Challenge d’ESPN
Pour qu’une équipe soit négligée, sa chance perçue de gagner doit être inférieure à sa chance réelle de gagner. La page Who Picked Whom fournit une estimation de la chance perçue de gagner, mais pour trouver des équipes sous-évaluées, nous avons également besoin d’estimations de la chance réelle de gagner. Cela peut aller d’un modèle de prédiction complexe à votre propre intuition. Les deux sources auxquelles je fais confiance sont les prédictions de 538 sur la March Madness et les cotes des paris futurs de Vegas. Les prédictions de 538 sont basées sur une combinaison de classements informatiques et ont bien prédit les performances lors des tournois précédents. Il y a également une raison de prêter attention aux cotes de Vegas, car si elles étaient trop éloignées, les paris sportifs perdraient de l’argent.
Cependant, les deux sources ont leurs défauts. 538 est basé sur des cotes informatiques, donc s’ils évitent le biais humain, ils passent à côté de l’intuition des experts. La plupart des paris sportifs de Vegas utilisent probablement à la fois les évaluations informatiques et l’intuition des experts pour créer leurs cotes de paris, mais ils sont fortement motivés pour avoir des paris égaux sur tous les côtés, donc ils sont considérablement affectés par la perception humaine. Par exemple, si tout le monde pariait sur Duke pour gagner le tournoi NCAA, ils augmenteraient la cote de Duke afin que davantage de personnes parient sur les autres équipes pour éviter de grosses pertes. Lors du calcul des probabilités de victoire pour cet article, j’ai choisi de faire la moyenne de 538 et des prédictions de Vegas pour obtenir un équilibre avec lequel j’étais à l’aise.
Regardons l’année dernière. La figure 2 compare la chance perçue d’une équipe de gagner (sur la base de Who Picked Whom d’ESPN) à sa chance réelle de gagner (sur la base des prédictions moyennes de 538-Vegas) pour les principales équipes du tournoi NCAA 2019. (Les probabilités pour les 64 équipes du tournoi figurent dans le tableau 6 en annexe.)
Figure 2. Chance réelle par rapport à la chance perçue de remporter la March Madness pour les 8 meilleures équipes
Comme le montre la figure 2, les participants ont sur-piqué Duke et la Caroline du Nord comme champions et ont sous-piqué Gonzaga et la Virginie. De nombreux facteurs ont contribué à ces sélections ; par exemple, la plupart des modèles prédictifs, des fans de sport avides et des parieurs étaient d’accord pour dire que Duke était la meilleure équipe l’année dernière. Si vous deviez choisir le bracket qui avait le plus de chances de se produire, alors choisir Duke comme champion était le choix naturel. Mais ignorer les choix effectués par les autres membres de votre pool ne vous aidera pas à gagner votre pool.
Bien que ce graphique soit intéressant, comment le transformer en éléments concrets à retenir ? Gonzaga et Virginia semblent être de bons choix, mais qu’en est-il du reste des équipes cachées dans ce coin inférieur gauche ? Est-il jamais utile de choisir des équipes comme Texas Tech, qui avait 2,6 % de chances de tout gagner, et que seulement 0,9 % des brackets ont choisi ? Dans quelle mesure le fait de choisir un favori surévalué comme Duke nuit-il à vos chances de remporter votre pool ?
Pour répondre à ces questions, j’ai simulé de nombreux pools de brackets et j’ai constaté que les équipes dans les places de Gonzaga et de Virginie sont généralement les meilleurs choix – les plus sous-évalués des quatre à cinq premiers favoris. Cependant, à mesure que la taille de votre groupe augmente, les têtes de série inférieures négligées, comme Texas Tech, troisième tête de série, ou Virginia Tech, quatrième tête de série, deviennent plus intéressantes. La logique de ce phénomène est simple : la probabilité qu’une de ces équipes gagne tout est faible, mais si elle le fait, alors vous gagnez probablement votre pool quel que soit le nombre de participants, car il est probable que personne d’autre ne les a choisis.
Méthodologie des simulations
Pour simuler des pools de bracket, j’ai d’abord dû simuler des brackets. J’ai utilisé une moyenne des prédictions de Vegas et du 538 pour effectuer de nombreuses simulations des événements réels de March Madness. Comme nous l’avons vu plus haut, cette méthode n’est pas parfaite mais c’est une bonne approximation. Ensuite, j’ai utilisé la page Who Picked Whom pour simuler de nombreux brackets créés par des humains. Pour chaque bracket humain, j’ai calculé la probabilité qu’il remporte une cagnotte de taille n en trouvant d’abord son rang centile parmi tous les brackets humains en supposant que l’un des 538 brackets simulés à Vegas était l’événement réel. Ce percentile est en fait la probabilité qu’il soit meilleur qu’un bracket aléatoire. J’ai élevé le percentile à la puissance n-1, puis j’ai répété pour tous les brackets simulés de 538-Vegas, en faisant la moyenne des résultats pour obtenir une seule probabilité de gain par bracket.
Par exemple, disons que pour une simulation de 538-Vegas, mon bracket est dans le 90e percentile de tous les brackets humains, et qu’il y a neuf autres personnes dans ma poule. La probabilité que je gagne la poule serait de 0,99=0,387. Si nous supposions une simulation différente, alors mon bracket pourrait n’être que dans le 20e percentile, ce qui rendrait ma probabilité de gagner 0,29≈0,0. En faisant la moyenne de ces probabilités pour les 538 simulations de Vegas, nous pouvons calculer une estimation de la probabilité de gain d’un bracket dans un pool de taille n, en supposant que nous faisons confiance à nos sources d’entrée.
Résultats
J’ai utilisé cette méthodologie pour simuler des pools de bracket avec 10, 20, 50, 100 et 1000 participants. Les résultats détaillés de ces simulations sont présentés dans les tableaux 1 à 6 de l’annexe. La Virginie et Gonzaga étaient les meilleurs choix de champions lorsque la poule comptait 50 participants ou moins. Pourtant, il est intéressant de noter que Texas Tech et Purdue (3 têtes de série) et Virginia Tech (4 têtes de série) étaient d’aussi bons ou de meilleurs choix de champion lorsque la poule comptait 100 participants ou plus.
Les points à retenir des simulations :
- Qu’importe la taille de la poule du bracket, le choix du champion est le plus important pour déterminer les chances de gagner une poule du bracket. Les choix avant le Final Four ont une importance limitée.
- Dans la plupart des pools, choisir le plus sous-évalué des quatre ou cinq favoris pour être le champion vous donne la meilleure chance de gagner.
- Dans les pools de bracket plus importants, choisir les équipes sous-évaluées moins bien classées vous donne la meilleure chance de gagner. Même dans les très grandes poules, il y a de bonnes chances que de telles équipes (ici, comme Virginia Tech) ne soient choisies comme championnes par personne. Même si leur chance réelle de tout gagner est faible, si c’est le cas, vous gagnerez probablement votre poule, quel que soit le nombre de participants.
Pensées supplémentaires
Nous avons supposé que votre poule locale fait ses sélections comme le reste de l’Amérique, ce qui n’est probablement pas vrai. Si vous vivez près d’une équipe qui participe au tournoi, alors cette équipe sera probablement sur-sélectionnée. Par exemple, j’habite à Charlottesville (où se trouve l’université de Virginie), et la Virginie a été choisie comme championne dans environ 40 % des casiers de mes poules au cours des deux dernières années. Si vous vivez à proximité d’une équipe bien placée, une stratégie consiste à commencer par les cotes de Who Picked Whom d’ESPN, puis à augmenter les cotes de l’équipe locale populaire et à diminuer en conséquence les cotes de toutes les autres équipes. Une autre stratégie que j’ai utilisée consiste à demander aux personnes de ma poule qui elles choisissent. C’est mutuellement bénéfique, puisque je serais moins susceptible de choisir celui qu’ils choisissent.
En guise de pensée finale, je veux décrire un scénario du tournoi NCAA 2019 que certains d’entre vous connaissent peut-être. Auburn, une cinquième tête de série, gagnait de deux points dans les derniers instants du match, lorsqu’elle a inexplicablement commis une faute sur l’équipe adverse en train de réaliser un tir à trois points à une seconde de la fin. Le joueur adverse, un tireur de lancer franc à 78%, s’est dirigé vers la ligne et a manqué deux des trois tirs, permettant à Auburn d’avancer. Il ne s’agit pas d’une réalité alternative ; c’est ainsi qu’Auburn a remporté son match de premier tour contre New Mexico State, classé 12e. Ils ont ensuite battu le Kansas, la Caroline du Nord et le Kentucky sur leur chemin vers le Final Four, où ils ont été confrontés à la même situation contre la Virginie. Kyle Guy, de Virginie, a réussi ses trois lancers francs, et la Virginie a remporté le championnat.
J’ajoute ceci pour souligner un important qualificatif de cette analyse – il est impossible de prédire avec précision la March Madness. Les personnes qui ont choisi Auburn pour aller au Final Four étaient-elles des génies ? Bien sûr que non. Si Terrell Brown de New Mexico State avait réussi ses lancers francs, ils auraient eu l’air idiot. Il n’existe pas de modèle parfait permettant de prédire l’avenir, et ceux qui réussissent dans les cagnottes ne sont pas des gourous du basket, ils ont simplement de la chance. La mise en œuvre des stratégies évoquées ici ne garantit pas la victoire, elle réduit simplement la part de chance dont vous avez besoin pour gagner. Et même avec les meilleurs modèles, vous aurez toujours besoin de beaucoup de chance. C’est la March Madness, après tout.
Annexe : Analyses détaillées par taille de pool
Au départ (au hasard), un bracket dans un pool de dix personnes a 10 % de chances de gagner. Le tableau 1 montre comment cette chance change en fonction du tour choisi pour la défaite d’une équipe donnée. Par exemple, les brackets qui prévoyaient la défaite de la Virginie en huitième de finale ont gagné une poule de dix personnes dans 4,2 % des cas, tandis que les brackets qui prévoyaient la victoire finale ont gagné dans 15,1 % des cas. Pour rappel, ces simulations n’ont été réalisées qu’avec des informations d’avant-tournoi – elles ne disposaient d’aucune donnée indiquant que la Virginie était le champion final, bien sûr.
Tableau 1 – Probabilité qu’un bracket gagne un pool de dix personnes étant donné qu’il avait une équipe donnée (ligne) se rendant à un tour donné (colonne) et pas plus loin
Dans les pools de dix personnes, les brackets les plus performants étaient ceux qui choisissaient Virginia ou Gonzaga comme champion, gagnant 15 % du temps. Notamment, les choix du premier tour n’ont pas eu une grande influence sur les chances de gagner la poule, à l’exception des brackets dont une tête de série 1 ou 2 perdait au premier tour. Les brackets qui avaient une graine de trois ou moins comme champion ont eu de très mauvaises performances, mais le fait d’avoir des graines inférieures faisant le Final Four n’a pas eu d’impact significatif sur la chance de gagner.
Le tableau 2 montre les mêmes informations pour les pools de bracket avec 20 personnes. La chance de base est maintenant de 5%, et à nouveau, les brackets les plus performants sont ceux qui ont choisi la Virginie ou Gonzaga pour gagner. De même, les choix effectués au cours des premiers tours n’ont pas beaucoup d’influence. Michigan State s’est maintenant hissé au troisième rang des meilleurs choix de champions et, fait intéressant, Purdue est le troisième meilleur choix de dauphin.
Tableau 2 – Probabilité qu’un bracket remporte un pool de bracket de 20 personnes étant donné qu’il avait une équipe donnée (ligne) se rendant à un tour donné (colonne) et pas plus loin
Lorsque la taille du pool de bracket augmente jusqu’à 50, comme le montre le tableau 3, choisir les favoris surévalués (Duke et North Carolina) comme champions réduit considérablement vos chances de base (2 %). Les têtes de série deux et trois légèrement sous-évaluées augmentent maintenant vos chances de base lorsqu’elles sont sélectionnées comme champions, mais Virginia et Gonzaga restent les meilleurs choix.
Tableau 3 – Probabilité qu’un bracket remporte un pool de bracket de 50 personnes étant donné qu’il avait une équipe donnée (ligne) se rendant à un tour donné (colonne) et pas plus loin
Avec un pool de bracket de 100 (tableau 4), Virginia et Gonzaga sont rejoints par les trois têtes de série sous-évaluées Texas Tech et Purdue. Choisir l’une de ces quatre équipes fait passer vos chances de base de 1 % à près de 2 %. Choisir Duke ou la Caroline du Nord nuit à nouveau à vos chances.
Tableau 4 – Probabilité qu’un bracket remporte un pool de bracket de 100 personnes étant donné qu’il avait une équipe donnée (ligne) se rendant à un tour donné (colonne) et pas plus loin
Lorsque le pool de bracket passe à 1000 personnes (tableau 5), on assiste à un changement complet de la garde. Virginia Tech est désormais le choix optimal de champion, faisant passer votre chance de base de gagner votre pool de 0,1 % à 0,4 %, suivi des trois têtes de série et de la sixième tête de série Iowa State sont les meilleurs choix de champion.
Tableau 5 – Probabilité qu’un bracket remporte une poule de 1000 personnes étant donné qu’il avait une équipe donnée (ligne) se rendant à un tour donné (colonne) et pas plus loin
Pour référence, le tableau 6 montre la chance réelle de gagner par rapport à la chance d’être choisi pour gagner pour toutes les équipes têtes de série septième ou mieux. Ces chances sont dérivées de la page ESPN Who Picked Whom et des prédictions de 538-Vegas. Les données relatives aux huit premières équipes du tableau 6 sont représentées dans la figure 2. Notamment, Duke et North Carolina sont surévalués, tandis que les autres sont tous au moins légèrement sous-évalués.
Les équipes en gras dans le tableau 6 sont des exemples d’équipes qui sont de bons picks de champions dans des pools plus importants. Elles ont toutes un rapport élevé entre la chance réelle de gagner et la chance d’être choisie pour gagner, mais une faible chance réelle globale de gagner.
Tableau 6 – Chances réelles de gagner le championnat vs chance que l’équipe soit choisie pour gagner le championnat. Les équipes sous-évaluées en vert ; surévaluées en rouge.
- Cela nécessite d’étudier la formule de paiement. J’ai utilisé le scoring standard d’ESPN (320 points possibles par tour) avec tout l’argent de la cagnotte donné au gagnant. (10 points sont attribués pour chaque victoire correcte au tour de 64, 20 au tour de 32, et ainsi de suite, en doublant jusqu’à ce que 320 soient attribués pour un appel correct du championnat)
.