Cours acp
Pratiquer une analyse en composantes principales
I - Objectif de l'ACP
1 - LA PLACE DE L'ACP DANS LES METHODES STATISTIQUES a) Lorsqu'on recueille des informations sur des individus ou unités statistiques ( un individu, au sens statistiques du terme, peut être une personne physique, une entreprise, un pays ,etc.) , on aboutit à la constitution d'un tableau individus-variables du type suivant :
individus I1 I2 I3 I4 I5 , , , In
V1
V2
V3
,
,
Vp
Ex. : les individus sont les 200 étudiants de 1e année de DEUG et les variables sont : l'âge, le sexe, le redoublement (oui/non), la série du bac, les notes en maths, stats, économie, etc. Pour décrire ces données, si elles sont nombreuses, le statisticien traitera d'abord les variables une par une (traitements univariés), puis il s'intéressera aux éventuelles interactions entre deux variables (traitement bivariés) voire plus (traitements multivariés). Après l'analyse descriptive des données (où toutes les variables sont placées sur le même plan), il poursuivra dans certains cas par une analyse explicative (il y a alors d'une part la variable expliquée, d'autre part les variables explicatives). Les variables (ou caractères) auxquels on s'intéresse sont essentiellement de deux natures : - les variables quantitatives (en abrégé VQT) sont mesurées par un nombre. ex. : âge, chiffre d'affaires, note en stats, température, poids - les variables qualitatives (en abrégé VQL) peuvent prendre plusieurs modalités : ex. : sexe, série du bac, code APE, jour de la semaine, profession L'ACP sert à décrire des tableaux "individus-variables quantitatives" de grande dimension (beaucoup de variables - c'est un traitement multivarié- et beaucoup d'individus -s'il y an a peu, inutile de faire appel à des outils statistiques pour résumer). Remarques : - dans les enquêtes d'opinion, on utilise souvent des variables d'un 3e type : les variables ordinales qui indiquent un rang de