Data
DATA MINING
& STATISTIQUE DÉCISIONNELLE
27/01/2009
© Stéphane Tufféry - Data Mining - http://data.mining.free.fr
1
Présentation de l’auteur
• En • • •
charge de la statistique et du data mining dans un grand groupe bancaire Enseigne le data mining en Master 2 à l’Université ParisDauphine, à l’Université Rennes 1 et à l’ISUP (Université Paris 6) Docteur en Mathématiques Auteur de : • Data Mining et Scoring (épuisé), Éditions Dunod, 2002 • Data Mining et Statistique Décisionnelle, Éditions Technip,
2005, 2de édition 2007, préface de Gilbert Saporta Ouvrage consacré à l’application en entreprise des techniques et méthodologies de data mining et statistique
© Stéphane Tufféry - Data Mining - http://data.mining.free.fr
27/01/2009
2
Présentation du cours
• Cette • •
présentation est issue de cours donnés dans des DESS et Master 2 d’Économétrie et d’Ingénierie Statistique entre 1999 et 2009. Ces enseignements ont ensuite trouvé un développement dans des ouvrages publiés chez Dunod puis chez Technip. Ces cours sont donc consacrés aux techniques de data mining, de statistique décisionnelle et de scoring, et à leur mise en oeuvre en entreprise. Ils contiennent une introduction, une partie technique (préparation des données, analyse factorielle, régression linéaire, régression logistique, GLM, analyse discriminante, arbres de décision, réseaux de neurones, algorithmes génétiques, SVM, k-means et centres mobiles, CAH…) et une partie méthodologique (conduite de projet, facteurs de succès, RSI, aspects informatiques, CNIL…).
© Stéphane Tufféry - Data Mining - http://data.mining.free.fr 3
27/01/2009
Plan du cours
• Qu’est-ce que le data mining ? • A quoi sert le data mining ? • Les deux grandes familles de techniques • Le déroulement d’un projet de data mining • Coûts et gains du data mining • Facteurs de succès - Erreurs - Consulting • Informatique décisionnelle et de gestion • La préparation des données •