Une infime partie de l'analyse des données

Pages: 8 (1817 mots) Publié le: 18 juillet 2013
Travail élaboré par ******

ANALYSE FACTIORIELLE DES CORRESPONDANCES
1) Principes :
Analyse multivariée, c’est-à-dire analyse des données qui permet de traiter simultanément plusieurs variables.
Dans son principe, l’A.F.C. a pour objet d’étudier simultanément les lignes et les colonnes d’un tableau de chiffres et de mettre en évidence les “correspondances”, c’est-à-dire les liaisons entreces deux ensembles.
L’esprit humain étant incapable de prendre en compte en même temps autant de données, c’est l’A.F.C. (et l’ordinateur qui effectue les calculs) qui projette sur un mapping à deux dimensions l’essentiel de l’information.
Le principe de ces méthodes est de partir sans a priori sur les données et de les décrire en analysant la hiérarchisation de l'information présente dans lesdonnées. Pour ce faire, les analyses factorielles étudient l'inertie du nuage de points ayant pour coordonnées les valeurs présentes sur les lignes du tableau de données.
La "morphologie du nuage" et la répartition des points sur chacun de ces axes d'inertie permettent alors de rendre lisible et hiérarchisée l'information contenue dans le tableau. Mathématiquement, après avoir centré et réduit letableau de données que l'on a affecté d'un système de masse (par exemple, les sommes marginales de chaque ligne), on calcule la matrice d'inertie associée et on la diagonalise (la répartition de l'information selon les différents axes est représentée par l'histogramme des valeurs propres). On effectue alors un changement de base selon ses vecteurs propres, c'est-à-dire selon les axes principauxd'inertie du nuage de points. On projette alors les points figurant chaque ligne sur les nouveaux axes. L'ensemble de l'information est conservée, mais celle-ci est maintenant hiérarchisée, axe d'inertie par axe d'inertie. L'histogramme des valeurs propres permet de voir le type de répartition de l'information entre les différents axes et l'étendue en dimension de celle-ci.
Le premier axe d'inertieoppose les points, c'est-à-dire les lignes du tableau ayant les plus grandes distances ou "différences". La première valeur propre d'inertie, (associée à ce premier axe) mesure la quantité d'information présente le long de cet axe, c'est-à-dire dans cette opposition. On analyse ainsi les différents axes, en reconstituant progressivement la totalité des données.
Plusieurs méthodes d'analyse descorrespondances existent, qui diffèrent par le type de représentation de l'information, c'est-à-dire de métrique, ou de système de masse qu'elles utilisent.
L'analyse factorielle des correspondances AFC développée par Jean-Paul Benzecri et ses collaborateurs emploie la métrique du chi-deux : chaque ligne est affectée d'une masse qui est sa somme marginale, le tableau étudié est le tableau desprofils des lignes, ce qui permet de représenter dans le même espace à la fois les deux nuages de points associés aux lignes et aux colonnes du tableau de données ; elle est par ailleurs très agréablement complétée par des outils de classification ascendante hiérarchique (CAH) qui permettent d'apporter des visions complémentaires, en particulier en construisant des arbres de classification des lignes oudes colonnes.
Pour chaque point représentatif des lignes ou des colonnes du tableau de données, nouvel axe par nouvel axe, on s'intéresse à ses nouvelles coordonnées, au cosinus carré de l'angle avec l'axe (ce qui est équivalent à un coefficient de corrélation), ainsi qu'à sa contribution à l'inertie expliquée par l'axe (c'est-à-dire à sa contribution à la création de l'axe).
Deux contraintesparticulières sur les données sont à signaler : d'une part, les tableaux ne peuvent comporter de cases vides et d'autre part, seules des valeurs positives sont permises. De plus, compte tenu de la métrique du chi-deux employée par l'AFC, cette méthode accorde une importance plus grande aux lignes de somme marginale élevée. Si nous utilisons des tableaux quantitatifs et souhaitons équilibrer la...
Lire le document complet

Veuillez vous inscrire pour avoir accès au document.

Vous pouvez également trouver ces documents utiles

  • Résultats de recherche l'analyse conceptuelle des données
  • Introduction a l'analyse des donnée marketing
  • La collecte des données et l’analyse univariée des resultats
  • La relation salaire-emploi à partir de l'analyse de keynes
  • Application des logiciels à l’analyse informatisée des données en sciences sociales et humaines
  • Quelle(s) image(s) de ste colombe nous est-il donnée à travers la première partie du roman/film ?
  • Qu’elle représentation la pièce « fin de partie » donne d’elle de l’humanité ?
  • L'analyse

Devenez membre d'Etudier

Inscrivez-vous
c'est gratuit !