Analyse canonique
[pic]
[pic]
[pic]
[pic]
[pic]
[pic]
[pic]
[pic]
[pic]
[pic]
[pic]
-----------------------
Les données
2 tableaux de données : le tableau X1 à n lignes et m1 colonnes le tableau X2 à n lignes et m2 colonnes
[pic]
Le principe de l'analyse canonique
Le principe de l'analyse canonique :
* Mettre en évidence des proximités entre deux ensembles de données. Ce qui se traduit par décrire ces proximités entre les deux tableaux de variables que nous avons à notre disposition.
A-Les composantes canoniques * L'algorithme de l'analyse canonique :
* A la première étape : L'algorithme détermine un couple de variables canoniques (Z1 1; Z1 2 ) tel que le coefficient de détermination R² (Z1 1 Z1 2 ) = Cov² (Z1 1; Z1 2 ) Var [Z1 1]Var [Z1 2 ] ait une valeur maximale sous la contrainte: Var [Z1 1] = Var [Z1 2 ] = 1:
Remarques :
* 1. Z1 1 est donc le premier vecteur propre de P1P2 Z1 2 est donc le premier vecteur propre de P2P1,où: * P1 désigne le projecteur orthogonal sur l'espace engendré par les colonnes de X1 P2 désigne le projecteur orthogonal sur l'espace engendré par les colonnes de X2.
* 2. Z1 1 est une combinaison linéaire des variables du tableau X1 Z1 2 est une combinaison linéaire des variables du tableau X2
Les valeurs des projecteurs P1 et P2 :
Rappel d'algèbre linéaire * Définition : Le projecteur orthogonal sur l'espace E engendré par les colonnes de X est l'application linéaire qui fait correspondre à u sa projection orthogonale sur E. Ce projecteur s'écrit: P = X(X’X)É[?]¹X
Remarques : 3. Ces deux vecteurs propres Z1 1 et Z1 2 sont associés à la même valeur propre qui est égale au coefficient de détermination R2 (Z1 1 ; Z1 2 ) 4. Z1 1 estˉ¹X’
Remarques :