ACP et AFC QUEST REP
I- L’Analyse en Composantes Principales
Définition
1- Qu’est ce que l’ACP ?
C’est l’ensemble de techniques multi variées qui ont pour but principal de réduire et de résumer les données.
C’est une technique d’interdépendance dans laquelle toute les variables sont considérées simultanément.
2- Quels sont les objectifs de l’ACP ?
Repérer des groupes d’individus, homogènes vis-à-vis de l’ensemble des caractères.
Révéler des différences entre individus ou groupes d’individu, relativement à l’ensemble des caractères.
Réduire l’information qui permet de décrire la position d’un individu dans l’ensemble de la population
3- Que permet l’ACP ?
Elle permet une analyse des diverses variables statistiques définies sur les caractères étudiés.
Elle permet de construire des variables artificielles (car non mesurés mais calculés à partir des données) qui expliquent l’ensemble des variables statistiques prises en compte dans l’ACP
4- Qu’est ce qu’on obtient ?
On obtient ainsi un ensemble de nouvelles variables, en plus petits nombre que les variables initiales. Chacune de ces variables initiales est liée à l’ensemble des variables artificielles retenus.
Nature des données : variables quantitatives
5- Qu’est ce que la matrice de corrélation ?
C’est une matrice R dont les éléments sont les corrélations des variables prises 2 à 2
R= (rij=cor (Xi, Xj))
6- Interprétation de la matrice de corrélation
Plus les variables présentent de fortes corrélation plus elles peuvent être regroupés en dimensions homogènes. Sinon elles sont hétérogènes.
7- Quel est le problème qui se pose quand les variables sont hétérogènes ?
Grand nombre de variables et visualisations
8- Qu’est ce que le KMO ?
Kaiser – Meyer – Olkin est un réel compris entre 0 et 1.
Un KMO assez élevé (> 0,6) est indispensable pour obtenir une ACP intéressante.
9- En quoi consiste le test de sphéricité de Bartlett ?
On test l’hypothèse H0 : indépendance entres les variables contre H1 : association