analyse des données

Pages: 7 (1527 mots) Publié le: 29 décembre 2013
1) Introduction et historique :
L’analyse de données apparait au cours des années trente à l’époque des travaux du psychologue américain HOTELLING, prolongeant les travaux, au début du siècle, des psychométriciens SPEARMAN et PEARSON. Ces travaux visaient à expliquer un facteur sous-jacent d’aptitude à partir d’autres paramètres observés chez un groupe de patients. Cette première méthode seraplus tard appelée l’analyse factorielle des psychologues
Comme la statistique, l’analyse de données « réfrénant son vol mathématique, doit s’honorer d’être une science expérimentale »
A la différence de la statistique, qui étudie généralement une ou deux variables aléatoires en se fondant sur des hypothèses (distribution, probabilités) l’analyse de données construit à partir de la réalitéobservée, des hypothèses, en étudiant simultanément plusieurs variables. Ce qui la différencie donc principalement de la statistique, est son caractère multidimensionnel. De ce caractère découle un ensemble de méthodes particulières à l’analyse de données.
2) Définition de l’analyse de données :
L'analyse des données est un ensemble de techniques descriptives, dont l'outil mathématique majeur estl'algèbre matricielle, et qui s'exprime sans supposer a priori un modèle probabiliste. Elle comprend l’analyse en composantes principales (ACP), employée pour des données quantitatives, et ses méthodes dérivées : l'analyse factorielle des correspondances (AFC) utilisée sur des données qualitatives (tableau d’association) et l'analyse factorielle des correspondances multiples (AFCM ou ACM) généralisant laprécédente. L'analyse canonique et l'analyse canonique généralisée, qui sont plus des cadres théoriques que des méthodes aisément applicables, étendent plusieurs de ces méthodes et vont au-delà des techniques de description. L'Analyse Factorielle Multiple est adaptée aux tableaux dans lesquels les variables sont structurées en groupes et peuvent être quantitative et/ou qualitatives. Laclassification automatique, l’analyse factorielle discriminante (AFD) permettent d’identifier des groupes homogènes au sein de la population du point de vue des variables étudiées.
3) Domaine d’application :
L'analyse des données est utilisée dans tous les domaines dès lors que les données se présentent en trop grand nombre pour être appréhendées par l'esprit humain.
4) L’analyse factorielle :
a méthodede l'analyse factorielle date du début du 20ième siècle (Spearman, 1904) et a connu de nombreux développements, plusieurs méthodes de calcul ayant été proposées. Si cette méthode a d'abord été utilisée par les psychométriciens, son champ d'application s'est peu à peu étendu à de nombreux autres domaines, par exemple en géologie, médecine, finance. On distingue aujourd'hui deux grands typesd'analyse factorielle :
l'analyse factorielle exploratoire
l'analyse factorielle confirmatoire
4-1) Passer de p variables a k facteurs :
L'exemple historique de Speaman, même s'il a depuis fait l'objet de nombreuses critiques et améliorations, permet de bien comprendre le principe et l'utilité de la méthode. En analysant les corrélations entre les notes obtenues par des enfants dans différentesmatières, Spearman a voulu faire l'hypothèse que les notes dépendaient finalement d'un seul facteur, l'intelligence, avec une partie résiduelle due à un effet individuel, culturel ou autre.
Ainsi la note obtenue par l'individu (i) dans une matière (j) peut s'écrire x(i,j) = µ + b(j)F + e(i,j), avec µ la note moyenne de l'échantillon étudié, et où F est le niveau d'intelligence de l'individu (lefacteur sous-jacent) et e(i,j) le résidu.
En généralisant cette écriture à p matières (les variables d'entrée) et à k facteurs sous-jacents, on obtient le modèle suivant : (1) x = µ + Λf + u où x est un vecteur de dimension (p x 1), µ est le vecteur moyen, Λ est la matrice (p x k) des coordonnées factorielles (loadings en anglais) et f et u sont des vecteurs aléatoires de dimensions respectives...
Lire le document complet

Veuillez vous inscrire pour avoir accès au document.

Vous pouvez également trouver ces documents utiles

  • Analyse de données
  • Analyse des données
  • Analyse des données
  • Analyse des données
  • Analyse des données
  • analyse de données
  • Analyse de données
  • Analyse des donnees

Devenez membre d'Etudier

Inscrivez-vous
c'est gratuit !