Cours acp

Disponible uniquement sur Etudier
  • Pages : 11 (2696 mots )
  • Téléchargement(s) : 0
  • Publié le : 18 mai 2011
Lire le document complet
Aperçu du document
Maryse Raffestin – octobre 2005

Pratiquer une analyse en composantes principales
I - Objectif de l'ACP

1 - LA PLACE DE L'ACP DANS LES METHODES STATISTIQUES a) Lorsqu'on recueille des informations sur des individus ou unités statistiques ( un individu, au sens statistiques du terme, peut être une personne physique, une entreprise, un pays ,etc.) , on aboutit à la constitution d'un tableauindividus-variables du type suivant :

individus I1 I2 I3 I4 I5 , , , In

V1

V2

V3

,

,

Vp

Ex. : les individus sont les 200 étudiants de 1e année de DEUG et les variables sont : l'âge, le sexe, le redoublement (oui/non), la série du bac, les notes en maths, stats, économie, etc. Pour décrire ces données, si elles sont nombreuses, le statisticien traitera d'abord les variablesune par une (traitements univariés), puis il s'intéressera aux éventuelles interactions entre deux variables (traitement bivariés) voire plus (traitements multivariés). Après l'analyse descriptive des données (où toutes les variables sont placées sur le même plan), il poursuivra dans certains cas par une analyse explicative (il y a alors d'une part la variable expliquée, d'autre part les variablesexplicatives). Les variables (ou caractères) auxquels on s'intéresse sont essentiellement de deux natures : - les variables quantitatives (en abrégé VQT) sont mesurées par un nombre. ex. : âge, chiffre d'affaires, note en stats, température, poids - les variables qualitatives (en abrégé VQL) peuvent prendre plusieurs modalités : ex. : sexe, série du bac, code APE, jour de la semaine, professionL'ACP sert à décrire des tableaux "individus-variables quantitatives" de grande dimension (beaucoup de variables - c'est un traitement multivarié- et beaucoup d'individus -s'il y an a peu, inutile de faire appel à des outils statistiques pour résumer). Remarques : - dans les enquêtes d'opinion, on utilise souvent des variables d'un 3e type : les variables ordinales qui indiquent un rang declassement (ex : classer des produits par ordre de préférence, se situer sur une échelle allant de "très favorable" à "très défavorable", etc.) - on peut passer d'une variable quantitative (total des points obtenus à un concours) à une variable ordinale (rang de classement au concours) puis à une variable qualitative (reçu / collé). Mais l'inverse n'est pas possible. En effectuant cette transformation, onperd de l'information. C'est le cas lorsqu'on passe d'une variable QT (ex. : "effectif salarié") à une variable classifiée ("tranche d'effectif" avec par ex. 3 classes : petites, moyennes et grandes entreprises) qui devient alors une variable QL.

b) Les traitements statistiques des variables qualitalives et des variables fondamentalement différents. C'est vrai notamment pour les méthodesdescriptives :

quantitatives

sont

- caractères qualitatifs : Traitement univarié : on calculera la distribution des effectifs ni ou des fréquences fi = ni/n selon les différentes modalités. On pourra éventuellement noter la modalité dominante (celle qui a la plus forte fréquence), parfois appelée "mode" par analogie aux variables quantitatives. Traitement bivarié : lorsqu'on répartit unepopulation selon 2 caractères qualitatifs, on constitue un tableau de contingence. Ce tableau peut être très grand (donc illisible) si les caractères étudiés comportent beaucoup de modalités(ex. : répartition de la population française par régions et classes d'âges). Une technique d'analyse factorielle, l'analyse factorielle des correspondances (AFC) sert à décrire les grands tableaux de contingence.Lorsque l'observation porte sur un échantillon, le test du χ2 sert à juger de l'indépendance de ces 2 caractères - caractères quantitatifs : Traitement univarié : on peut calculer la moyenne et l'écart-type, ainsi que les quantiles (médiane, quartiles, déciles , centiles...). Lorsque l'observation porte sur un échantillon, on peut estimer ces paramètres par intervalle de confiance. Traitement...
tracking img