Arbre de decision
2
Plan
Introduction
Arbre de décision
Algorithme ID3
Exemple
Conclusion
3
Introduction
Dans les domaines de l'aide à la décision (informatique décisionnelle et entrepôt de données), il est essentiel de produire des procédures de classification compréhensibles par l'utilisateur.
On distingue deux classification :
supervisé: Les arbres de décision, Les réseaux de neurones…
non-supervisé: regroupement, densité, hiérarchique…
4
Arbre de décision
Outil d’aide à la décision qui représente la situation sous la forme graphique d'un arbre.
permet de répartir une population d'individus (de clients par exemple) en groupes homogènes, selon un ensemble de variables discriminantes (montant,âge, résidence …) en fonction d'un objectif fixé et connu (consulter l’e-mail…).
5
Exemple introductif
Algorithmes d’apprentissage par arbres de décision
6
Algorithme d’apprentissage générique
Entrée: échantillon S
début
Initialiser l’arbre courant à l’arbre vide ; la racine est le nœud courant
répéter
Décider si le nœud courant est terminal
Si le nœud est terminal alors
sinon
fin
Lui affecter une classe
Sélectionner un test et créer autant de nouveaux nœuds fils qu’il y a de réponses possibles au test
Finsi
Passer au nœud suivant non exploré s’il en existe
Jusqu’à obtenir un arbre de décision
Construction d'un arbre de décision 7
Le but est: Construction du plus petit arbre de façon à
Problèmes: Choix de l’attribut ?
créer des règles de décision simples.
8
Les Algorithmes proposé
ID3 (Iterative Dichotomiser 3) : 1986 par Quinlan
C4.5, C5 (successeurs d'ID3) : 1993 par Quinlan
CHAID (Chisquared Automatic Interaction Detector)
Exhaustive CHAID
CART (Classification And Regression Tree) : 1984 par Breiman