Cours et exos stats anova
1. Introduction
Nous allons voir comment la technique du test de Fisher (voir Régression linéaire multiple) peut être utilisée pour apprécier d'un certain point de vue la pertinence de certains classements d'observations.
Posons le problème sur l'exemple concret (mais artificiel) suivant :
On observe les dépenses annuelles en vêtements de n = 7 individus, qui habitent des grandes villes, des communes moyennes, ou des communes rurales :
Trois observations "grandes villes" : 128, 142, 98 Deux observations "communes moyennes " : 101, 85 Deux observations "communes rurales" : 67, 86
Ces observations permettent-elles de conclure à l'existence d'un effet "catégorie d'agglomération" sur le montant des dépenses de vêtements ?
En d'autres termes, peut-on rejeter l'hypothèse d'une espérance de dépense égale, quelle que soit la catégorie de résidence ?
2. Modélisation du problème.
On imagine le modèle suivant : l'observation numéro k dans la catégorie i est une variable aléatoire [pic][pic] définie par :
[pic]
|i : numéro de la catégorie (i = 1, 2, 3) |m : moyenne générale |
|k : numéro de l'observation dans la catégorie i |[pic] : effet dû à la catégorie i |
|[pic] : kième dépense de la catégorie i |[pic] : résidu aléatoire suivant une loi normale N[pic] (et |
| |indépendant des autres résidus aléatoires). |
Objectif : tester l’effet de la catégorie d’agglomération.
H0 : (1=(2=(3=0 contre H1 : l’un des coefficients (1, (2, (3 est non nul
Nous obtenons alors différentes écritures pour ce modèle :
2.1. Première écriture :
[pic]
2.2 Deuxième écriture (écriture "vectorielle")
[pic]
Ce qui s'écrit encore :