Spad

Disponible uniquement sur Etudier
  • Pages : 14 (3481 mots )
  • Téléchargement(s) : 0
  • Publié le : 8 novembre 2009
Lire le document complet
Aperçu du document
L’ANALYSE DES DONNEES A L’AIDE DU LOGICIEL SPADn 

Base de données : « Faculty Salaries »

SOMMAIRE

Partie introductive 4

Description de la base de données 6

L’analyse des composantes principales 9

La description des données 9
Les variables 9
Les individus 10

SELECTION DES INDIVIDUS ET DES VARIABLES UTILES 11

VARIABLES CONTINUES ACTIVES 11
5 VARIABLES 11INDIVIDUS 11

ANALYSE EN COMPOSANTES PRINCIPALES 12

La recherche des axes principaux 12
HISTOGRAMME DES 5 PREMIERES VALEURS PROPRES 13
La représentation des variables 14

Le cercle des corrélations 15

La représentation des individus 17

La classification 17

2.1. Classification hiérarchique par la méthode Ward 17
2.2 La consolidation des classes 21
La descriptiondes classes 22
La caractérisation parmi les « individus typiques » 23

Conclusion 23

ANNEXE 1 24

MATRICE DES CORRELATIONS 24
MATRICE DES VALEURS-TESTS 24

Annexe 2 25

RECHERCHE DE PALIERS ENTRE (DIFFERENCES SECONDES) 25
INTERVALLES LAPLACIENS D'ANDERSON 25
ETENDUE ET POSITION RELATIVE DES INTERVALLES 25

La galerie de graphiques sur données de base 26

Lesgraphiques de densité 27

Construction d’une filière STATS 28

Les histogrammes 29

Histogrammes et courbe de densité normale 30

Graphiques DISCRÉTISÉS 30

La régression linéaire 31

Partie introductive

Le but de ce projet est une présentation détaillée de l’intérêt et de l’efficacité des méthodes descriptives des tableaux statistiques dans l'analyse de grands volumes dedonnées.

L'exemple choisi fait référence à 50 universités de top de l’Association des Universités Américaines et aux pourcentages des professeurs à plein temps, des associés et des assistants à ces universités

En tenant compte de la nature quantitative des variables, on va faire dans la première partie l’analyse dans des composants principaux. Le but est de présenter dans un espacede deux dimensions les différentes universités de l’exemple.

Ensuite, on va examiner les principaux axes créés et bien sûr, la qualité de la représentation des variables et des individus dans cet espace de deux dimensions.

On va essayer d’expliquer comment la réalisation de la prévision de la population dans ce secteur d’activité a été réalisée.

[pic]
[pic]

Description dela base de données

Nom de la base de données: « Faculty Salaries »

Sujets de la base de données: Finance , Education

Nom de l’histoire: « Professors' Pay »

Référence: « Faculty Compensation and Benefits Committee » (1993, April). Ohio State University

Description:

Salaires moyens pour les professeurs à 50 universités de top de l’Association des Universités Américaines. Salairesdes professeurs à plein temps, des associés et des assistants à ces universités ont été donnés. Données 1992-1993 de l’Université Clark ne sont pas disponibles; Salaires 1991-1992 salaries ont été remplacés.

Nombre des cas: 50

Noms des variables:
1. University: Nom de l’université
2. CICinstitutions: 1 si dans le Committee on Institutional Cooperation (the Big Ten* plus Universityof Chicago); 0 si l’université n’est pas dans le CIC
3. AverageSalary: Salaire moyen de tous les professeurs universitaires si on tient compte du fait que toutes les proportions de la faculté sont les mêmes que les proportions de l’Université Ohio State
4. FullProfSalary: Salaire moyen pour les professeurs à plein temps à l’Université en 1992
5. AssocProfSalary: Salaire moyen pour lesprofesseurs associés à l’Université en 1992
6. AsstProfSalary: Salaire moyen des assistants universitaires en 1992

Les données sur lesquelles on a travaillé sont les suivantes :

|University |CICinstitutions |AverageSalary |FullProfSalary |AssocProfSalary |AsstProfSalary |
|DUKE |0 |64.47 |83...
tracking img