Cours acp

1514 mots 7 pages
Analyse en composantes principales
Christine Decaestecker & Marco Saerens ULB & UCL

LINF 2275

Stat. explor. multidim.

1

A.C.P.: Analyse en Composantes Principales
• Analyse de la structure de la matrice variance-covariance c-à-d de la variabilité, dispersion des données.
Excepté si l’une des variables peut s’exprimer comme une fonction d’autres, on a besoin des p variables pour prendre en compte toute la variabilité du système

Objectif de l’ACP: décrire à l’aide de q < p composantes un maximum de cette variabilité.
• Ce qui permet : - une réduction des données à q nouveaux descripteurs - une visualisation des données à 2 ou 3 dimensions (si q = 2 ou 3) - une interprétation des données : liaisons inter-variables • Etape intermédiaire souvent utilisée avant d’autres analyses !

LINF 2275

Stat. explor. multidim.

2

• Recherche des composantes principales
Composantes : C1 , C2 ,…, Ck ,…, Cq Ck = nouvelle variable = combinaison linéaire des variables d’origine X1,…, Xp: Ck = a1k X1 + a2k X2 + …... + apk Xp coefficients ajk à déterminer telle que les Ck soient: - 2 à 2 non corrélées, - de variance maximale, - d’importance décroissante. C1 = 1ère composante principale doit être de variance maximale Géométriquement : C1 détermine une nouvelle direction dans le nuage de points qui suit l’axe d’allongement (étirement) maximal du nuage. , x ip) ci1 = coordonnée du point i sur l’axe C1 x i2 , … , C1 i = (x i1 projection de xi sur C1 ci1 ci1 = ∑ a1 j xij j =1

p

les projections ci1 sont les plus dispersées possible. C1 de variance maximale Pour fixer la droite, on impose qu’elle passe par g (centre de gravité) ! (sinon l’ensemble des droites parallèles conviennent)
LINF 2275 Stat. explor. multidim. 3

C1 = droite passant par le centre de gravité réalisant le meilleur ajustement possible du nuage c-à-d : qui conserve au mieux la distance entre les points (après projection) => droite de projection assurant une distorsion minimale. C2

en relation

  • corrigé livre de maths terminale sti2d/ stl édition Nathan technique chapitre statistiques à 2 variables
    1885 mots | 8 pages
  • Histoir
    704 mots | 3 pages
  • Epreuve1_Puissances
    754 mots | 4 pages
  • Cours aeh
    2732 mots | 11 pages
  • Dm maths ecs
    577 mots | 3 pages
  • Cours erc
    532 mots | 3 pages
  • 01_ctrle_rappel_suites_25_09_2012 1
    733 mots | 3 pages
  • Cours acrc
    468 mots | 2 pages
  • Cours escp
    1453 mots | 6 pages
  • Cours epe
    13380 mots | 54 pages
  • Maths
    564 mots | 3 pages
  • LaReunion 2011 cor
    2778 mots | 12 pages
  • Cours
    532 mots | 3 pages
  • Brevet
    551 mots | 3 pages
  • Maths
    344 mots | 2 pages