datamining

Pages: 61 (15147 mots) Publié le: 31 janvier 2014
COURS DE DATA MINING
Stéphane TUFFERY

Université Rennes 1
Master 2 Ingénierie économique et financière
Octobre 2011
14/10/2011

© Stéphane Tufféry - Usage réservé à l’Université Rennes 1

1

Présentation de l’intervenant






Responsable de l’équipe statistique dans un
grand groupe bancaire
Enseigne le data mining en Master 2 à l’Université
Rennes 1 et à l’UniversitéCatholique de l’Ouest
(Angers)
Docteur en Mathématiques
Auteur de :
 Data Mining et Statistique
Décisionnelle, Éditions Technip, 2005,
3e édition 2010, préface de Gilbert
Saporta
 Data Mining and Statistics for Decision
Making, Éditions Wiley, mars 2011
 Étude de cas en Statistique
Décisionnelle, Éditions Technip, 2009

14/10/2011

© Stéphane Tufféry - Usage réservé àl’Université Rennes 1

2

Plan













Qu’est-ce que le data mining ?
A quoi sert le data mining ?
L’élaboration d’un modèle de scoring
La sélection des variables
La modélisation
La mesure du pouvoir discriminant
Questionnaire adaptatif en scoring
Quelques principes du data mining
L’agrégation de modèles
La détection des règles d’associations
Conclusion

14/10/2011© Stéphane Tufféry - Usage réservé à l’Université Rennes 1

3

Qu’est-ce que le data mining ?

14/10/2011

© Stéphane Tufféry - Usage réservé à l’Université Rennes 1

4

La fouille de données


Le data mining est l’ensemble des :











techniques et méthodes
… destinées à l’exploration et l’analyse
… de (souvent) grandes bases de donnéesinformatiques
… en vue de détecter dans ces données des règles, des
associations, des tendances inconnues (non fixées a priori),
des structures particulières restituant de façon concise
l’essentiel de l’information utile
… pour l’aide à la décision

On parle d’extraire l’information de la donnée
Selon le MIT, c’est l’une des 10 technologies émergentes
qui « changeront le monde » au XXIe siècleL’ONU a déclaré le 20 octobre Journée mondiale de la
statistique

14/10/2011

© Stéphane Tufféry - Usage réservé à l’Université Rennes 1

5

Intérêt du data mining






On ne veut pas simplement confirmer des intuitions a priori par des
requêtes dans les bases de données mais détecter sans a priori les
combinaisons de critères les plus discriminantes
Par exemple, dans le domainecommercial, on ne veut plus seulement
savoir :
 « Combien de clients ont acheté tel produit pendant telle période ? »
Mais :
 « Quel est leur profil ? »
 « Quels autres produits les intéresseront ? »
 « Quand seront-ils intéressés ? »



Les profils de clientèle à découvrir sont en général des profils
complexes : pas seulement des oppositions « jeunes/seniors »,
« citadins/ruraux»… que l’on pourrait deviner en tâtonnant par des
statistiques descriptives

>

Le data mining fait passer
 d’analyses confirmatoires
 à des analyses exploratoires

14/10/2011

© Stéphane Tufféry - Usage réservé à l’Université Rennes 1

6

Les 2 types de techniques de DM


Les techniques descriptives (recherche de « patterns ») :







visent à mettre en évidencedes informations présentes
mais cachées par le volume des données (c’est le cas des
segmentations de clientèle et des recherches d’associations de
produits sur les tickets de caisse)
réduisent, résument, synthétisent les données
il n’y a pas de variable à expliquer

Les techniques prédictives (modélisation) :




visent à extrapoler de nouvelles informations à partir desinformations présentes (c’est le cas du scoring)
expliquent les données
il y a une variable à expliquer

14/10/2011

© Stéphane Tufféry - Usage réservé à l’Université Rennes 1

7

Les 2 principales familles de méthodes
descriptives

carte de Kohonen
Source : Lebart-Morineau-Piron, Statistique exploratoire multidimensionnelle, page 10
14/10/2011

© Stéphane Tufféry - Usage réservé à...
Lire le document complet

Veuillez vous inscrire pour avoir accès au document.

Vous pouvez également trouver ces documents utiles

  • Le datamining
  • Datamining
  • DataMining Partie1 Introduction
  • Datamining et Scoring pour le marketing

Devenez membre d'Etudier

Inscrivez-vous
c'est gratuit !