Doc dissertation gratuites
Module 1 : Présentation de l’analyse de données
M1
Présentation de l’analyse de données
« L’analyse des données a pour but de fournir grâce à l’ordinateur un outil permettant d’appréhender le contenu de tableaux de taille importante à l’aide de représentations accessibles par l’utilisateur », Edwin Diday. L’analyse des données c’est aujourd’hui l’expression consacrée pour désigner les analyses statistiques descriptives multidimensionnelles L’analyse des données rassemble un groupe de techniques aux fondements mathématiques qui permet d’appréhender la structure de l’information contenue dans un espace à plusieurs dimensions. L’information, c’est la position relative des points dans l’espace multidimensionnel. L’analyse des données est réalisable lorsqu’il est possible de réduire l’espace multidimensionnel (où l’information n’est pas lisible) en un espace à deux ou trois dimensions (où l’information est lisible), de telle sorte que cet espace réduit conserve une part importante de l’information qui était contenue dans l’espace multidimensionnel d’origine. Les espaces multidimensionnels ont pour origine des tableaux statistiques de données de toute nature mais où les dimensions des lignes et des colonnes sont importantes. Ce sont ces lignes et ces colonnes qui constituent les dimensions des espaces et les points qui forment les nuages informationnels. L’analyse des données est utilisée par la plupart des sciences appliquées : les psychologues, les juristes, les historiens, les économistes, les gestionnaires… L’analyse des données a ses premiers développements mathématiques au début du siècle précédent (1905). Elle a cependant connu un essor sans précédent dans les années 70 et 80, grâce à l’amélioration des instruments de calcul et au développement de la micro-informatique. Sous l’expression générique de l’analyse des données, on rassemble deux grandes techniques : les analyses factorielles : ces méthodes doivent leur nom aux nouveaux