Analyse en composante principale
L'analyse en composantes principales (A.C.P.)
1 mars 2010
André Bouchier
Analyses en composantes principales - 1 mars 2010
p.1/44
2010, André Bouchier (20 Janvier 2010) http://creativecommons.org/licenses/by-nc-sa/2.0/fr/ Le document « L'analyse en composantes principales (A.C.P.) » by A.Bouchier est mis à disposition selon les termes de la licence Creative Commons Paternité-Pas d'Utilisation Commerciale-Partage des Conditions Initiales à l'Identique 2.0 France.
Analyses en composantes principales - 1 mars 2010
p.2/44
1.Avant propos : l Pré-recquis
On suppose connues les bases du logiciel R ainsi que quelques notions de statistiques concernant l'analyse en composantes principales. l Les fonctions utilisées : Les fonctions utilisées pour cette analyse sont disponibles dans les bibliothèques standard de R et dans la bibliothèque ade4. Pour aider à la compréhension, l'écriture des «programmes» sera détaillée. Par la suite, vous pourrez condenser cette écriture. Mais n'oubliez pas de les commenter abondamment.
Analyses en composantes principales - 1 mars 2010
p.3/44
2.Rappels : l L’ACP est une méthode descriptive. l Son objectif est de représenter sous forme graphique l’essentiel de l’information contenue dans un tableau de données quantitatif. l Dans un tableau de données à j variables, les individus se trouvent dans un espace à j dimensions.
Analyses en composantes principales - 1 mars 2010
p.4/44
3.La représentation graphique :
Lorsqu’il n’y a que deux dimensions (largeur et longueur), il est facile de représenter les données sur un plan : Avec trois dimensions (largeur, hauteur et profondeur), c’est déjà plus difficile :
l Mais au delà de 3 dimensions, il est impossible de représenter les données
sur un plan ou même de les visualiser mentalement
Analyses en composantes principales - 1 mars 2010
p.5/44
4.Projeter la réalité sur un plan