Slises tanagra
Fabien Moutarde Centre de Robotique (CAOR) Ecole des Mines de Paris (MINES ParisTech) Fabien.Moutarde@ensmp.fr
Brève introduction aux arbres de décision
Fabien Moutarde, CAOR, MINES ParisTech
21/05/2008
1
Qu’est-ce qu’un arbre de décision ?
Classification par une série de tests
Brève introduction aux arbres de décision Fabien Moutarde, CAOR, MINES ParisTech 21/05/2008 2
Avantage/inconvénients des arbres de décision
• Avantages
– – – – Facilité à manipuler des données « symboliques » OK avec variables d’amplitudes très différentes Interprétabilité Classification très efficace
• Inconvénients
– Sensibilité au bruit et points aberrants
Brève introduction aux arbres de décision
Fabien Moutarde, CAOR, MINES ParisTech
21/05/2008
3
Principe général des arbres de décision
• Décomposition du problème de classification en une suite de tests correspondant à une partition de l’espace des données en sous-régions homogènes en terme de classe
Brève introduction aux arbres de décision Fabien Moutarde, CAOR, MINES ParisTech 21/05/2008 4
Exemple d’arbre de décision
• Règle de classification : aller de la racine à une feuille en effectuant les tests des nœuds • Classe d’une feuille : classe majoritaire parmi les exemples d’apprentissage appartenant à cette feuille
Brève introduction aux arbres de décision
Fabien Moutarde, CAOR, MINES ParisTech
21/05/2008
5
Problématique de l’induction de l’arbre
Est-ce le meilleur arbre ?
Brève introduction aux arbres de décision Fabien Moutarde, CAOR, MINES ParisTech 21/05/2008 6
Induction de l’arbre à partir d’une base d’exemples d’apprentissage
• Recherche exhaustive dans l’ensemble de tous les arbres évidemment computationnellement impossible approche récursive pour construire l’arbre :
construire-arbre(X)
SI tous les points de X sont de même classe, créer une feuille associée à cette classe SINON - choisir (selon