Cours De Statistiques 1
Les distributions à deux caractères
Ajustement, régression et corrélation
La 1ère partie traitait une seule dimension (colonne xi et ni). Dans cette partie, on va doubler l’information (xi, yj et ni). Ce tableau porte le nom de tableau de contingence.
On va chercher à calculer des moyennes (pour x et y).
Chapitre I : Présentation des données
Section 1 : Les tableaux de contingence
Paragraphe 1 : Construction des tableaux de contingence
A) Les différents types de distribution à deux caractères
On a plusieurs types car les variables présentes plusieurs combinaisons de caractères (quantitatifs discrets, continues ou qualitatifs).
B) Exemples de répartition
On a la répartition de 17500 diplômés. On remarque que deux tableaux à une dimension n’équivalent pas un tableau à deux dimensions car on ne connait pas le nombre de diplômés dans chaque classe.
La ligne et la colonne appelées ici « Total », prennent le nom de « marges ». Si l’on associe la marge du bas et la ligne du haut (yj), on obtient la distribution des 17500 jeunes salariés selon leur salaire net (en milliers d’euros). Cette distribution est à une dimension.
On l’appelle distribution marginale du caractère y. De même ; la dernière colonne (Total) associée à la première, n’est autre que la distribution marginale des individus selon leur âge.
Si l’on s’en tenait uniquement à cette double représentation à une dimension, c’est-à-dire, en utilisant seulement les distributions marginales, rien ne nous permettrait de déterminer si l’âge a une influence sur le niveau de salaire, ou l’inverse.
Le tableau de contingence, par contre, nous permet de voir comment se distribuent les effectifs de chaque modalité d’un caractère, suivant les modalités de l’autre. On a, en quelque sorte, « croisé » l’information.
Dans le totale des colonnes, on remplace par un point, l’indice qui varie.
Les marges correspondent aux distributions marginales.
C) Contenus et Lectures des tableaux de