Data mining sur la premier league

Disponible uniquement sur Etudier
  • Pages : 8 (1945 mots )
  • Téléchargement(s) : 0
  • Publié le : 9 mai 2010
Lire le document complet
Aperçu du document
DATA MINING
Pari sportif sur la Premier League
Sommaire
Introduction
Aujourd’hui le monde des paris sportifs est en pleine expansion. D’ailleurs les jeux de loterie ou casino font partie de notre monde depuis bien longtemps. Il est dit que 90% des gains sont remportés par 10% des joueurs. Pourquoi cela ? Parce que ceux-ci jouent de manière ‘intelligente’ (technique de jeu, étude desdonnées). Les entreprises du jeu restent largement bénéficiaires car les 90% des joueurs restant jouent aléatoirement, par superstition, émotion… Pour réussir,il faut quand même bien sélectionner sont jeu. Par exemple l’euro millions est bien trop aléatoire. Par contre les paris sportifs peuvent eux être beaucoup moins aléatoires après plusieurs études. Nous avons donc décidés de nous pencher surun type particulier de pari : Les paris combinés (3 matchs / 4) sur la premier league anglaise. Et pour notre étude, nous allons étudier les différentes techniques du datamining.
I. Qu’est ce que le DataMining ?
Le DataMining est un ensemble de processus d'étude, statistiques en général, qui vise à découvrir des interactions et des phénomènes cachés (au sens de "non connus par lesinitiateurs de l'étude") dans une masse en général importante de données. Ces méthodes rassemblées sous le nom de DataMining sont assorties d'une méthodologie circulaire (un schéma de la méthodologie "CRISP-DM" par exemple ci-dessous) pour leur mise en oeuvre : c'est le "cercle vertueux" du DataMining.
{draw:frame}
Les domaines d'application du DataMining sont très variés : il s'agit de laquasi-intégralité des domaines où la statistique a droit de cité. Ainsi l'industrie pharmaceutique, le marketing, la gestion des ressources humaines, la chimie, la sociologie, l'économétrie, l'assurance, la banque, le crédit, la grande distribution...
Dans notre cas les données utilisées sont toutes les statistiques sur les 4 dernières saisons (résultats, classement avant chaque match, matchdomicile/extérieur, cartons….). C’est à partir de ces données là que l’on va essayer de tirer différents conclusions sur les matchs qu’il faut choisir dans notre pari et la probabilité que ce pari soit gagnant.
II. Présentation de l’étude
1. Première étude
Comme nous l’avons précisé plus tôt, nous voulons dégager de nos résultats une technique de pari qui sur une saison nous permettra de gagnerde l’argent de manière (quasi) certaine. Ne sachant pas à l’avance quels sont les critères primordiaux dans notre étude nous avons créé un premier fichier avec les données basées autour des 4 clubs ayant terminés en moyenne aux meilleures places sur les 4 dernières années (Manchester United, Chelsea, Arsenal, Liverpool). C’est bien pour cela que nous avons choisi la premier league anglaise, carsur les 4 dernières années ceux sont les 4 mêmes équipes qui finissent facilement aux 4 premières places. C’est le seul championnat européen qui nous apporte cette stabilité.
A. Tableau de données
Nombre de victoire totale
Nombre de match nul
Nombre de défaite
Nombre de victoire à domicile
Nombre de victoire à l’extérieur
Nombre de victoire contreun TOP 4 à domicile
Nombre de victoire contre un TOP 4 à l’extérieur
Nombre de victoire contre un non TOP 4 à domicile
Nombre de victoire contre un non TOP 4 à l’extérieur
Tout cela en sachant qu’il y a 38 matchs dans l’année dont 18 à domicile et 18 à l’extérieur. Ainsi que 6 matchs entre TOP 4 et donc 32 matchs contre des non TOP 4 (pour les équipes de TOP 4). Leséquipes composant le TOP 4 sont les 4 équipes citées précédemment. Nous avons récoltés toutes ces données à partir des sites suivants :
http://www.playerhistory.com/Default.aspx?page=national_countryCmpSeasonList&nationID=238
http://premiersoccerstats.com/epl.html#
http://chiffresdufootball.free.fr/?surfpage=saison&lang=fra&compet=Prem+League&saison=2006&group=1
Puis...
tracking img