Statistiques spss

Disponible uniquement sur Etudier
  • Pages : 8 (1938 mots )
  • Téléchargement(s) : 0
  • Publié le : 21 décembre 2010
Lire le document complet
Aperçu du document
ESG – 2 ème année GF
Statistique et analyse des données
A.U. 10 / 11

Analyse Exploratoire des Données
Tri à plat et tris croisés

« Les statistiques ne dispensent pas d’être intelligent »
(Alfred Sauvy)

I - Buts de l’analyse statistique

Observer
Décrire
Expliquer
Confirmer

• Décrire de façon précise, organiser et résumer les données d’une étude afin de pouvoir les interpréteret communiquer les résultats aux autres utilisateurs.

• Déterminer les relations entre les variables à partir des données de l’échantillon.

II - Définitions de base

• Population: ensemble de tous les objets ou sujets qui
Possèdent une ou plusieurs caractéristiques communes.

• Échantillon: sous-ensemble d’une population.
• Peut-être plus ou moins représentatif de la population àl’étude.
• Plus l’échantillon est grand plus il sera représentatif.
• Il existe différentes méthodes d’échantillonnage.

• Statistique :
Descriptive: vise essentiellement à résumer l’information d’un ensemble de données à l’aide d’indices numériques et/ou graphiques.
Inférentielle (décisionnelle): permet de tirer des conclusions sur l’ensemble de la population étudiée à partir de statistiquescalculées sur un ou plusieurs échantillons.

Prévisionnelle: A partir de données passées observées sur une variable dépendante du temps, essayer de prévoir les valeurs futures de cette même variable.

• Types de variables 

• Qualitative Nominale (catégorielle):
Données de catégorisation. Dans l’échelle nominale, la variable est séparée en catégories et chacune a un nom. Les catégories ne sontpas comparables.
(Sexe de l’individu, nationalité, secteur d’activité, …)
• Qualitative Ordinale:
Échelle qui implique un ordre entre les sujets, objets ou modalités.
La distance entre les rangs n’est pas nécessairement la même.
(mention obtenue, degré de satisfaction, classes d’age, classes de salaire, …)
• Quantitative (ou échelle):
Caractère mesurable, prenant des valeurs en nombrefini ou infini. Échelle avec laquelle on peut ordonner les sujets ou objets.
(age, salaire, taille, nombre d’enfant, chiffre d’affaire, distance parcourue, …)

III – Description et visualisation :

1 - Présentation des données dans un tableau :

Dans un tableau :
• Variables qualitatives : Modalité en fonction des effectifs et/ou % (pourcentages cumulés pour les variables ordinalesseulement)
[pic]

• Variables quantitatives : Echantillon de valeurs ou classes de valeurs, en fonction des effectifs et/ou %.

Dans un graphique :
• Variables qualitatives : diagramme en bâtons ou secteurs.
• Variables quantitatives : histogramme ou boite à moustaches.

[pic]

[pic]

2 - Analyse univariée : ou Tri à plat

a- Variable qualitative :

-Tableau des effectifs, fréquences-Fréquences cumulées pour les variables ordinales.
-Graphique en bâtons, et graphe en secteurs.

b- Variable quantitative (échelle) :

• Histogramme
• Mesures de la tendance centrale (moyenne, mediane, mode)
• Indices de dispersion (etendue, variance, ecart-type)
• Boite à moustaches
• Forme (indice d’symétrie )
•Distribution
normale (symétrique)

Mesures de la tendance centrale :
• La tendance centrale est une mesure qui indique où se trouve la majeure partie des données ou scores d’une distributions.
Mesure qui représente le score typique d’une distribution. C’est la valeur qui résume globalement la distribution.
Il y a 3 types de mesures:
• Mode
• Médiane
• Moyenne

Mode
•Valeur la plus fréquente d’une distribution

7 1 3 5 8 5 6 5 1
Le mode est 5. Un seul mode donc distribution unimodale .
Il peut y exister plusieurs modes (distribution multimodales)

Médiane
• Le point sur l’échelle des valeurs **ordonnés numériquement** au dessous duquel se situent 50% d’individus.
• La médiane est la donnée qui divise la distribution en 2.
7 1 3 5 8 5 6 5 1
1 1 3 5...
tracking img