Spad
Base de données : « Faculty Salaries »
SOMMAIRE
Partie introductive 4
Description de la base de données 6
L’analyse des composantes principales 9
La description des données 9 Les variables 9 Les individus 10
SELECTION DES INDIVIDUS ET DES VARIABLES UTILES 11
VARIABLES CONTINUES ACTIVES 11 5 VARIABLES 11 INDIVIDUS 11
ANALYSE EN COMPOSANTES PRINCIPALES 12
La recherche des axes principaux 12 HISTOGRAMME DES 5 PREMIERES VALEURS PROPRES 13 La représentation des variables 14
Le cercle des corrélations 15
La représentation des individus 17
La classification 17
2.1. Classification hiérarchique par la méthode Ward 17 2.2 La consolidation des classes 21 La description des classes 22 La caractérisation parmi les « individus typiques » 23
Conclusion 23
ANNEXE 1 24
MATRICE DES CORRELATIONS 24 MATRICE DES VALEURS-TESTS 24
Annexe 2 25
RECHERCHE DE PALIERS ENTRE (DIFFERENCES SECONDES) 25 INTERVALLES LAPLACIENS D'ANDERSON 25 ETENDUE ET POSITION RELATIVE DES INTERVALLES 25
La galerie de graphiques sur données de base 26
Les graphiques de densité 27
Construction d’une filière STATS 28
Les histogrammes 29
Histogrammes et courbe de densité normale 30
Graphiques DISCRÉTISÉS 30
La régression linéaire 31
Partie introductive
Le but de ce projet est une présentation détaillée de l’intérêt et de l’efficacité des méthodes descriptives des tableaux statistiques dans l'analyse de grands volumes de données.
L'exemple choisi fait référence à 50 universités de top de l’Association des Universités Américaines et aux pourcentages des professeurs à plein temps, des associés et des assistants à ces universités
En tenant compte de la nature quantitative des variables, on va faire dans la première partie l’analyse dans des composants principaux. Le but est de présenter dans un espace de