Segmentation sous spad
Pierre-Louis GONZALEZ
1
I. Les méthodes de segmentation. Introduction g
Les méthodes de segmentation cherchent à résoudre les problèmes de discrimination et de régression en divisant de façon progressive g ç p g l’échantillon en sous-groupes (segments), pour construire un arbre de décision. Lors de chaque dichotomie, les deux parties sont les plus contrastées vis-à-vis de la variable à expliquer. Les premières approches ont été proposées par Sonquist et Morgan (1964) avec l méthode di A (A la é h d dite AID (Automatic Interaction Detection). i i i )
I. I Les méthodes de segmentation. Introduction segmentation
Les travaux de Breiman , Friedman, Olshen et Stone (1984) connus sous le nom de méthode CART ( Classification And Regression Tree) ont donné un nouvel essor à la segmentation.
Notons que les méthodes ne sont pas toujours présentes dans les logiciels statistiques « classiques » Par contre de nombreux produits ». spécifiques sont présents sur le marché et connaissent un succès croissant avec le développement du data mining.
3
I. Les méthodes de segmentation. Introduction qualitative :
Ménage propriétaire de sa résidence principale Hôtel équipé de la climatisation Diagnostic médical
Expliquer une variable
ARBRE DE DECISION q quantitative :
C.A. d’entreprise/salarié Taux de mémorisation d’une annonce Salaire d un cadre d’un
REGRESSION PAR ARBRE
I. Les méthodes de segmentation. Introduction Arbre de décision
T t1 t3 t7 t1 t8 t8
:S Segments i t t intermédiaires édi i : Segments terminaux
5
t2 t4 t5 t6
II. Les méthodes de segmentation. Exemple
Intéressons-nous à l’audience d’une revue mensuelle auprès d’un échantillon de 10000 personnes. La variable à expliquer Y est le fait de lire li ou d ne pas li l revue. L variables explicatives sont au de lire la Les i bl li ti t nombre de 6 : • • • Sexe (2) : M F Âge (2) : =65 ans Niveau d’études (5) : Primaire, Primaire-Sup, Secondaire, Supérieur • CSP (6)