Doc dissertation gratuites

Disponible uniquement sur Etudier
  • Pages : 115 (28607 mots )
  • Téléchargement(s) : 0
  • Publié le : 3 novembre 2011
Lire le document complet
Aperçu du document
Analyse des données

Module 1 : Présentation de l’analyse de données

M1

Présentation de l’analyse de données

« L’analyse des données a pour but de fournir grâce à l’ordinateur un outil permettant d’appréhender le contenu de tableaux de taille importante à l’aide de représentations accessibles par l’utilisateur », Edwin Diday. L’analyse des données c’est aujourd’hui l’expressionconsacrée pour désigner les analyses statistiques descriptives multidimensionnelles L’analyse des données rassemble un groupe de techniques aux fondements mathématiques qui permet d’appréhender la structure de l’information contenue dans un espace à plusieurs dimensions. L’information, c’est la position relative des points dans l’espace multidimensionnel. L’analyse des données est réalisable lorsqu’il estpossible de réduire l’espace multidimensionnel (où l’information n’est pas lisible) en un espace à deux ou trois dimensions (où l’information est lisible), de telle sorte que cet espace réduit conserve une part importante de l’information qui était contenue dans l’espace multidimensionnel d’origine. Les espaces multidimensionnels ont pour origine des tableaux statistiques de données de toutenature mais où les dimensions des lignes et des colonnes sont importantes. Ce sont ces lignes et ces colonnes qui constituent les dimensions des espaces et les points qui forment les nuages informationnels. L’analyse des données est utilisée par la plupart des sciences appliquées : les psychologues, les juristes, les historiens, les économistes, les gestionnaires… L’analyse des données a ses premiersdéveloppements mathématiques au début du siècle précédent (1905). Elle a cependant connu un essor sans précédent dans les années 70 et 80, grâce à l’amélioration des instruments de calcul et au développement de la micro-informatique. Sous l’expression générique de l’analyse des données, on rassemble deux grandes techniques : les analyses factorielles : ces méthodes doivent leur nom aux nouveauxaxes de l’espace que l’on peut réduire, qui portent le nom d’axes principaux, mais aussi de facteurs. Les techniques de classification automatique : ce sont des algorithmes informatiques automatiques capables de dresser des typologies, des regroupement de points, bref d’effectuer des classifications.

Ce sont les analyses factorielles qui font l’objet de ce cours.

I du tableau de données àl’analyse des données
Les analyses de données ont pour matière principale le tableau de données. De la nature de ce tableau dépend la nature des variables qui le composent. L’individu est un élément d’un ensemble fini que l’on appelle l’ensemble des individus. Ils sont portés en ligne du tableau. La description de ces individus est réalisée par des variables. Les variables sont portées en colonne dutableau. Une variable est définie par un ensemble que l’on appelle l’ensemble des observations (qui sont portées à l’intérieur du tableau) par une structure algébrique sur cet ensemble et par une application de l’ensemble des individus sur l’ensemble des observations. Plus généralement, une variable est un caractère statistique particulier. On dénombre deux types de caractères : quantitatif etqualitatif. Le caractère quantitatif est mesurable, c’est-à-dire qu’il prend ses valeurs dans des ensembles mathématiques comme par exemple l’ensemble des entiers naturels relatifs, réels… C’est ce caractère qu’on appelle variable.

2 / 11

Analyse des données

Module 1 : Présentation de l’analyse de données

M1

Le caractère qualitatif est non mesurable. Il est qualifié par des modalités.On considère qu’il existe deux types de modalités : des modalités qu’on peut classer (ex : petit, moyen, grand), des modalités où le classement est indifférent (ex yeux bleus, verts…). Caractère

Quantitatif (variable)

Qualitatif

Continu ∈R

Discret ∈ Z, ∈ N Ordinales

modalités

nominales

Classes

intervalles

Fréquemment, les variables quantitatives sont transformées en...
tracking img