Statistique
L'analyse des données à l’usage des non mathématiciens
2ème Partie: L'analyse en composantes principales
AGRO.M - INRA - Formation Permanente Janvier 2006
André Bouchier
Analyses multivariés. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
1/31
Copyright © André Bouchier. © 2006, André Bouchier (20 Janvier 2006) Permission est accordée de copier et distribuer ce document, en partie ou en totalité, dans n'importe quelle langue, sur n'importe quel support, à condition que la notice © ci-dessus soit incluse dans toutes les copies. Permission est accordée de traduire ce document, en partie ou en totalité, dans n'importe quelle langue, à condition que la notice © ci-dessus soit incluse.
Analyses multivariés. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
2/31
1.Quantifier la variabilité contenue dans un tableau de données :
l On appelle inertie la quantité d’information contenue dans un tableau de données.
l Une inertie nulle signifie que tous les individus sont presque identiques.
l L’inertie du nuage sera égale à la somme des variances des j caractères.
l Si les j caractères sont centrés-réduits, l’inertie sera égale à j.
Analyses multivariés. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
3/31
2.Projeter sur un plan un tableau de données à j dimensions
l L’ACP est une méthode descriptive.
l Son objectif est de représenter sous forme graphique l’essentiel de l’information contenue dans un tableau de données quantitatif.
l Dans un tableau de données à j variables, les individus se trouvent dans un espace à j dimensions.
Analyses multivariés. INRA formation permanente. Janvier 2006. L'Analyse en composantes principale
4/31
3.La représentation graphique
Lorsqu’il n’y a que deux dimensions (largeur et longueur par exemple), il est facile de représenter les données sur un plan : Avec trois dimensions