Analyse de données
1- Introduction générales et historique
2- Définition de l’analyse de données
3- Notions de base
4- Les principales méthodes de l’analyse des données
4-1 Les méthodes factorielles
4-1-1 • L’analyse en composantes principales (ACP)
4-1-2 • L'analyse factorielle des correspondances (AFC)
4-2 Les méthodes de classification
4-2-1 • La méthode des nuées dynamiques
4-2-2 • La classification ascendante hiérarchique
4-3 les méthodes prédictives
4-3-1 • La régression
4-3-2 • L’analyse discriminante
5- Condition d’utilisation
1- Introduction générales et historique :
L’analyse de données apparait au cours des années trente à l’époque des travaux du psychologue américain HOTELLING, prolongeant les travaux, au début du siècle, des psychométriciens SPEARMAN et PEARSON. Ces travaux visaient à expliquer un facteur sous-jacent d’aptitude à partir d’autres paramètres observés chez un groupe de patients. Cette première méthode sera plus tard appelée l’analyse factorielle des psychologues
Comme la statistique, l’analyse de données « réfrénant son vol mathématique, doit s’honorer d’être une science expérimentale »
A la différence de la statistique, qui étudie généralement une ou deux variables aléatoires en se fondant sur des hypothèses (distribution, probabilités) l’analyse de données construit à partir de la réalité observée, des hypothèses, en étudiant simultanément plusieurs variables. Ce qui la différencie donc principalement de la statistique, est son caractère multidimensionnel. De ce caractère découle un ensemble de méthodes particulières à l’analyse de données.
2- Définition de l’analyse de données :
L’analyse des données est un sous domaine des statistiques qui se préoccupe de la description de données conjointes. C’est un outil de visualisation. On cherche par ces méthodes à donner les liens pouvant exister entre les différentes données et à en tirer une information statistique qui permet