Responsabilite civile
Module 4 : L’ACP en pratique
M4
L’analyse en composantes principales en pratique
Après avoir vu sa formalisation mathématique dans le module précédent, on s’intéresse ici à l’utilisation pratique de l’ACP.
1 Objectifs
L’objectif de l’analyse en composantes principales (ou ACP) est purement descriptif : il s’agit « d’explorer » un ensemble d’observations rassemblées sous la forme d’un tableau de données indiquant pour chaque unité statistique les valeurs observées d’un certain nombre de variables quantitatives. L’unité statistique peu être primaire (par exemple un individu, une entreprise) ou secondaire. Dans ce dernier cas, il s’agit de regroupement d’unités statistiques primaires. Exemple d’unité statistique secondaire. On a interrrogé des clients d’un groupe bancaire sur la satisfaction de leur agence (notation de l’accueil, des heures d’ouverture, de la disponibilité, …). L’unité statistique primaire est l’individu. Si on veut travailler sur les agences du groupe bancaire (unité statistique secondaire) on calculera, par exemple, des moyennes de notation par agence pour chaque variable et on réalisera l’ACP en prenant comme individu les unités statistiques secondaires et comme variables les notes moyennes de chaque agence. Le tableau de données peut être de dimensions importantes : le nombre de lignes (d’unités statistiques) peut atteindre plusieurs centaines, et le nombre de colonnes (de variables) plusieurs dizaines. Le nombre d’observations, suivant son importance, pourra donner un caractère de généralité aux propriétés structurelles ; il est en effet rare que l’on fasse appel, dans le cadre de l’analyse de données multidimensionnelle, à la statistique inférentielle. L’analyse en composantes principales est fondée sur le calcul des moyennes, variances et coefficients de corrélation. Les données doivent donc être quantitatives : elles peuvent être discrètes ou ordinales (par ordre de préférence).
Exemple : On étudie les