Analyses factorielles
1
Chapitre V
ANALYSES FACTORIELLES
_____
Définition et propriétés des analyses factorielles : On est en présence d'un tableau de données réelles sous forme de matrice X (n,p) de n lignes et p colonnes. Les n lignes de X représentent un nuage de n points dans un Espace Vectoriel Rp de dimension p. (respectivement, les p colonnes représentent p points dans l'E.V. Rn ) Une représentation graphique de ces points dans cet espace est bien entendu impossible lorsque p>2. L'analyse de données propose une représentation graphique optimale dans R2, obtenue par la projection de ces points dans un plan (π) privilégié appelé plan factoriel.(ou plan principal)
r r Ce plan est un sous-espace de Rp, généré par les 2 premiers vecteurs propres u1 et u 2 du r r produit matriciel X'X (ou vecteurs propres v1 et v 2 du produit matriciel XX’) correspondant aux 2 plus grandes valeurs propres λ1 et λ2 de ce même produit. Ces deux vecteurs propres, lorsqu’ils sont unitaires, forment une base canonique du plan principal. Ces vecteurs définissant les axes factoriels, les valeurs propres représentent la valeur de la somme des carrés des projections des n points Miii dans Rp (respectivement, p points Pj dans Rn ) sur l'axe factoriel considéré, appelée variance expliquée par cet axe.
Ce procédé permet ainsi de faire de la classification, d'étudier les tendances et liens ou corrélations qui peuvent exister entre différents groupes de données.
Michel RAYNAUD
Statistiques Descriptives
Chap. V – Analyses Factorielles
2
1 - INTRODUCTION
L'analyse factorielle fait partie d'un ensemble de techniques retenu sous l'appellation d'analyse de données. L'analyse de données comporte deux principales orientations qui sont complémentaires, à savoir, l'analyse factorielle et la classification. Nous nous intéresserons à la première de ces méthodes, faisant suite logique aux chapitres précédents. En règle générale, il est bien difficile, lorsque