Mesures de dispersion d'une série statistique
1. classement des données en un tableau : c'est le tableau de la série statistique ;
2. représentation graphique de cette série ;
3. caractérisation de la série à l'aide de paramètres, afin, par exemple, de la comparer à d'autres séries statistiques.
Deux paramètres dits de position (la moyenne et la médiane) ont déjà été étudiés dans les classes antérieures. Sont définis ici des paramètres dits de dispersion : les quartiles, la variance, l'écart type et l'intervalle interquartile, ainsi qu'un nouveau type de représentation graphique, le diagramme en boîte, qui permet de comparer rapidement deux séries.
1. Comment calculer une variance et un écart type ?
Soit la série statistique de taille n suivante :
X x1 x2 … xp
Effectif n1 n2 … np n
On remarque que .
On rappelle que la moyenne de X est le nombre : .
• On appelle variance de la série statistique X le nombre : .
Ce que l'on écrit de manière plus compacte : .
• L'écart type de X est le nombre : .
Remarques
• La variance et l'écart type mesurent la façon dont les valeurs de X se dispersent autour de la moyenne. Ce sont des paramètres de dispersion (alors que la moyenne et la médiane sont des paramètres de position, ils précisent vers quelles valeurs se situe la série).
• On peut aussi calculer la variance à l'aide de la formule suivante : .
• Dans le cas où les valeurs de la variable sont réparties par classes, on remplace dans les formules xi par le centre de l'intervalle.
2. Comment calculer la médiane d'une série statistique ?
La médiane me est le nombre qui sépare la série ordonnée en deux groupes de même effectif.
Pour la déterminer, on écrit la liste de toutes les valeurs de la série par ordre croissant, chacune d'elle répétée autant de fois que son effectif.
Si l'effectif total n est un nombre impair, la médiane est le terme de rang .
Si l'effectif total n est un nombre pair, la médiane est le centre