L'analyse en composantes principales
I- Introduction
ACP est la plus simple et la plus connue des techniques d'Analyse de Données multi variées, qui sert à mettre en évidence des similarités ou des oppositions entre variables et à repérer les variables les plus corrélées entre elles, ou encore à transformer des variables liées entre elles (dites "corrélées" en statistique) en nouvelles variables indépendantes les unes des autres Ces nouvelles variables sont nommées "composantes principales", ou axes.
L’ACP propose, a partir d’un tableau rectangulaire de données comportant les valeurs de p variables quantitatives pour n unités (appelees aussi individus), des représentations géométriques de ces unités et de ces variables .Enfin, comme pour toute méthode descriptive, réaliser une ACP n’est pas une fin en soi. L’ACP servira à mieux connaıtre les données sur lesquelles on travaille, a détecter éventuellement des valeurs suspectes, et aidera à formuler des hypothèses qu’il faudra étudier a l’aide de modèles et d’études statistiques différentielles. l’analyse en composantes principales nous mettra en présence d’une équation très apparentée à l’équation de régression classique ayant la forme suivante : C1 = â1 var1 + â2 var2 + â3 var3… + âk vark
II- Historique de l’ACP :
L’Analyse en Composantes principales (ACP) fait partie du groupe des méthodes descriptives multidimensionnelles appelées méthodes factorielles Ces méthodes qui sont apparues au début des années 30 ont été surtout développées en France dans les années60.
L'ACP prend sa source dans un article de Karl Pearson publié en 19011. Le père du Test du χ² y prolonge ses travaux dans le domaine de la régression et des corrélations entre plusieurs variables. Pearson utilise ces corrélations non plus pour expliquer une variable à partir des autres (comme en régression), mais pour décrire et résumer l'information contenue dans ces variables.
Les champs