Résumer l'information statistique et mesurer la dispersion des données
I Résumer l'information et choisir la caractéristique la plus appropriée
L’étude des variables dites quantitatives, ne se limite pas aux seules représentations graphiques.
Il est souvent important de résumer les informations par des indicateurs numériques bien choisis Considérons par exemple la consommation des ménages résidant à Bissau au durant l’année
2010. Pour cet agrégat, il n’est pas question d’appréhender …afficher plus de contenu…
Graphique 4 : Détermination de la médiane d’une variable discrète
La droite horizontale d’ordonnée ½ peut correspondre à un palier représentant un intervalle médian. 3
Lamine Kazim ii Variable continue
La détermination de la médiane dans ce cas ne pose aucun problème et repose essentiellement sur l’hypothèse que les individus sont uniformément répartis dans chaque classe. La médiane
(Me) est la valeur x de la variable solution de l’équation F(x)=1/2. Cette solution est unique et appartient à une classe appelée classe médiane (ou intervalle médian) :
[ ] %50)(et %50)( avec , 11 ><∈= −− jjjj XfXfXXMex .
La médiane est ensuite calculée par interpolation linéaire suivant la formule : …afficher plus de contenu…
Remarque : On utilise aussi le terme, e e M
MQQd
2
231 −−
=
pour mesurer l’assymétries. On montre que, dans le cas d’une distribution uni modale, les deux indicateurs ont le même signe.
En outre, on utilise le premier et le second coefficient de Pearson pour mesurer le degré d’oblicité d’une courbe de fréquence. Ils caractérisent la dissymétrie. Ils s’obtiennent par :
Le premier coefficient de Pearson : typeécart emoyenne −
−= modν
10
Lamine Kazim Le second coefficient de Pearson : typeécart emoyenne −
−= )mod(3ν b Coefficient d’aplatissement ou Kurtosis
Le coefficient le plus utilisé est le coefficient γ2 de Fisher défini par