Analyses factorielles

Pages: 13 (3153 mots) Publié le: 6 juin 2013
Chap. V – Analyses Factorielles

1

Chapitre V

ANALYSES FACTORIELLES

_____

Définition et propriétés des analyses factorielles : On est en présence d'un tableau de données réelles sous forme de matrice X (n,p) de n lignes et p colonnes. Les n lignes de X représentent un nuage de n points dans un Espace Vectoriel Rp de dimension p. (respectivement, les p colonnes représentent p pointsdans l'E.V. Rn ) Une représentation graphique de ces points dans cet espace est bien entendu impossible lorsque p>2. L'analyse de données propose une représentation graphique optimale dans R2, obtenue par la projection de ces points dans un plan (π) privilégié appelé plan factoriel.(ou plan principal)

r r Ce plan est un sous-espace de Rp, généré par les 2 premiers vecteurs propres u1 et u 2 dur r produit matriciel X'X (ou vecteurs propres v1 et v 2 du produit matriciel XX’) correspondant aux 2 plus grandes valeurs propres λ1 et λ2 de ce même produit. Ces deux vecteurs propres, lorsqu’ils sont unitaires, forment une base canonique du plan principal. Ces vecteurs définissant les axes factoriels, les valeurs propres représentent la valeur de la somme des carrés des projections des npoints Miii dans Rp (respectivement, p points Pj dans Rn ) sur l'axe factoriel considéré, appelée variance expliquée par cet axe.
Ce procédé permet ainsi de faire de la classification, d'étudier les tendances et liens ou corrélations qui peuvent exister entre différents groupes de données.

Michel RAYNAUD

Statistiques Descriptives

Chap. V – Analyses Factorielles

2

1 - INTRODUCTIONL'analyse factorielle fait partie d'un ensemble de techniques retenu sous l'appellation d'analyse de données. L'analyse de données comporte deux principales orientations qui sont complémentaires, à savoir, l'analyse factorielle et la classification. Nous nous intéresserons à la première de ces méthodes, faisant suite logique aux chapitres précédents. En règle générale, il est bien difficile, lorsquele volume de données est important, de tirer des enseignements utiles sans traitement au préalable. Devant un nombre imposant de résultats, l'analyse de données donne une représentation graphique particulière de ces derniers. La qualité de la représentation graphique optimisée des points lignes (ou colonnes) est régie par la nature même de l’échantillon s(statistique. En effet, un nuage de pointsest d’autant mieux représenté qu’il se rapproche d’un plan. Par exemple, la représentation d’un nuage sous forme d’ellipsoïde sera d’autant plus fidèle que l’un de ses axes transversaux aura une faible longueur. (On peut imaginer une dragée de plus en plus plate). L’exploitation d’un graphique ainsi constitué se résume, en somme, en une compression de données où la lecture de l'information estune aide à la décision. Bien des ouvrages sont consacrés à cette étude, nous nous bornerons principalement au développement mathématique avec des exemples appropriés.

2 – ANALYSE GENERALE

On s’intéresse au tableau ou matrice X (n,p) de n lignes et p colonnes. Les n lignes de la matrice X, sont représentées par n points Mi i ={1,2,...,n} , dans l'espace Rp (ou p points dans l'espace Rn pour lescolonnes). Comme il a été dit précédemment, une telle représentation est certes inexploitable physiquement mais il existe un plan privilégié, appelé plan principal ou plan factoriel, où la projection du nuage de points est la plus fidèle possible. On sait que la projection raccourcit les distances et le plan factoriel s'arrange à respecter au mieux la valeur de ces distances projetées. Cettereprésentation est d'autant meilleure que le nuage de points se rapproche d'un plan. Rp M1 Hi (F1) Mi u O M2

Michel RAYNAUD

Statistiques Descriptives

Chap. V – Analyses Factorielles

3

On cherche ainsi à ajuster au mieux le nuage des n points (ou p points) par un sous-espace vectoriel de Rp (ou Rn), muni, dans un premier temps, de la distance euclidienne usuelle.

2.1 Détermination...
Lire le document complet

Veuillez vous inscrire pour avoir accès au document.

Vous pouvez également trouver ces documents utiles

  • L Analyse Factorielle
  • analyse factorielle
  • Analyse factorielles des données
  • Analyse Factorielle de correspondances simple
  • Analyse factorielle des données
  • Analyse en composante factorielle : exemple rh compagnie d'assurance
  • La théorie bi-factorielle
  • plan factoriel et fractionnaire

Devenez membre d'Etudier

Inscrivez-vous
c'est gratuit !