Data mining
Introduction et définition L ’objectif du Data Mining (DM) Le processus KDD Pratique du DM Méthodologie du DM
1
Introduction
Par analogie à la recherche des pépites d ’or dans un gisement, la fouille de données vise :
à extraire des informations cachées par analyse globale à découvrir des modèles (“patterns”) difficiles à percevoir
2
Définition
Data mining
ensemble de techniques d'exploration de données afin d'en tirer des connaissances (la signification profonde) sous forme de modèles présentés à l ’utilisateur averti pour examen Données entrepôt Data mining
Découverte de modèles
Connaissances
Compréhension Prédiction
3
Définition du DM
« l’ensemble des algorithmes et méthodes destinés à l’exploration et l’analyse de grandes bases de données informatiques en vue de détecter dans ces données, des règles, des associations, des tendances inconnues ,des structures particulières, restituant de façon concise, l’essentiel de l’information utile pour l’aide à la décision. »
4
Les 3 objectifs du Data minning
Expliquer : Analyser la variable à étudier (moyenne, variance, écart-type) Explorer : Chercher le lien entre les variables et élaborer un modèle (Covariance, Coefficient de corrélation) Confimer : Elaboler les hypothèses pour valider le type de modèle
5
Connaissances
Knowledge Discovery in Databases (KDD)
Processus complet d’Extraction de Connaissance des Données (ECD) Comprend plusieurs phases dont le data mining
6
Le processus de KDD
7
Mécanismes de base
Déduction : base des systèmes experts
schéma logique permettant de déduire un théorème à partir d'axiomes le résultat est sûr, mais la méthode nécessite la connaissance de règles méthode permettant de tirer des conclusions à partir d'une série de faits généralisation un peu abusive indicateurs de confiance permettant la pondération
8
Induction : base du data mining