analyse des données
L’analyse de données apparait au cours des années trente à l’époque des travaux du psychologue américain HOTELLING, prolongeant les travaux, au début du siècle, des psychométriciens SPEARMAN et PEARSON. Ces travaux visaient à expliquer un facteur sous-jacent d’aptitude à partir d’autres paramètres observés chez un groupe de patients. Cette première méthode sera plus tard appelée l’analyse factorielle des psychologues
Comme la statistique, l’analyse de données « réfrénant son vol mathématique, doit s’honorer d’être une science expérimentale »
A la différence de la statistique, qui étudie généralement une ou deux variables aléatoires en se fondant sur des hypothèses (distribution, probabilités) l’analyse de données construit à partir de la réalité observée, des hypothèses, en étudiant simultanément plusieurs variables. Ce qui la différencie donc principalement de la statistique, est son caractère multidimensionnel. De ce caractère découle un ensemble de méthodes particulières à l’analyse de données.
2) Définition de l’analyse de données :
L'analyse des données est un ensemble de techniques descriptives, dont l'outil mathématique majeur est l'algèbre matricielle, et qui s'exprime sans supposer a priori un modèle probabiliste. Elle comprend l’analyse en composantes principales (ACP), employée pour des données quantitatives, et ses méthodes dérivées : l'analyse factorielle des correspondances (AFC) utilisée sur des données qualitatives (tableau d’association) et l'analyse factorielle des correspondances multiples (AFCM ou ACM) généralisant la précédente. L'analyse canonique et l'analyse canonique généralisée, qui sont plus des cadres théoriques que des méthodes aisément applicables, étendent plusieurs de ces méthodes et vont au-delà des techniques de description. L'Analyse Factorielle Multiple est adaptée aux tableaux dans lesquels les variables sont structurées en groupes et peuvent être quantitative et/ou qualitatives. La