Web minig
DATA MINING
& STATISTIQUE DÉCISIONNELLE
25/12/2006
© Stéphane Tufféry - Data Mining - http://data.mining.free.fr
1
• Qu’est-ce que le data mining ? • A quoi sert le data mining ? • Les 2 grandes familles de techniques • Le déroulement d’un projet de data mining • Coûts et gains du data mining • Facteurs de succès - Erreurs à éviter • L’analyse et la préparation des données • Techniques descriptives de data mining • Techniques prédictives de data mining • Logiciels de statistique et de data mining • Informatique décisionnelle et de gestion • CNIL et limites légales du data mining • Le web mining • Le text mining
25/12/2006 © Stéphane Tufféry - Data Mining - http://data.mining.free.fr 2
Plan du cours
Le Web Mining
25/12/2006
© Stéphane Tufféry - Data Mining - http://data.mining.free.fr
3
Définition du Web Mining
• •
Web Mining = Data Mining appliqué aux données de navigation sur le web Objectifs du Web Mining (Web Usage Mining) : 1) Optimiser la navigation dans un site, afin de maximiser le confort des internautes, d’augmenter le nb de pages consultées et l’impact des liens et des bannières publicitaires ⇒ Analyses globales 2) Déceler les centres d’intérêt, et donc les attentes, des internautes venant sur le site de l’entreprise ⇒ Analyses individuelles 3) Mieux connaître les clients qui se connectent nominativement à un site, en croisant leurs données de navigation avec leurs données personnelles détenues par l’entreprise ⇒ Analyses nominatives Web Content Mining : Recherche d’informations sur le web et « crawling » des pages web par les moteurs de recherche
© Stéphane Tufféry - Data Mining - http://data.mining.free.fr 4
•
25/12/2006
1) Analyses globales
• Statistique descriptive
• • • • • •
• Détection des règles d’associations
« 70 % des internautes ont consulté 3 pages ou moins » « 40 % des internautes accèdent au site sans passer par la page d’accueil » « 20 % des internautes visitant