La régression multiple
La régression multiple est une méthode d’analyse appropriée pour un ensemble de variables quantitatives. On l’utilise pour tester une équation de régression entre plusieurs variables indépendantes et une variable dépendante. On l’utilise selon le même principe que la régression simple entre deux variables.
Les buts de la régression multiple sont :
1. tester une équation de régression (modèle);
2. évaluer la force du lien entre l’ensemble des variables indépendantes et la variable dépendante;
3. d’établir l’importance relative de chaque variable indépendante dans le modèle;
Voici un exemple :
Nous voulons vérifier l’impact du nombre de cours, nombre d’heures de travail rémunéré, du nombre d’heures total d’étude, et du nombre d’heures d’étude consacré au cours sur le résultat scolaire (variable Note).
L’échantillon étant assez grand, le test F est significatif à 0,002 ce qui signifie que prise, globalement, la régression est significative; cependant la droite n’explique que 3 % du nuage de points. Il faut regarder l’encadré suivant, pour décider, grâce au test t, s’il y a un lien entre chacune des variables indépendantes et la variable dépendante. Ici on voit que seules les variables q112 (négativement) et q113 (signe positif) sont associées à la note.
Pour juger de l’importance relative de chacune des variables indépendantes, on utilisera le coefficient Bêta, qui est en fait un coefficient standardisé dont l’emploi est justifié par le fait que les unités de mesure ne sont pas les mêmes pour les variables indépendantes et indépendantes. Ce coefficient est obtenu en multipliant le coefficient B par le ratio de l’écart type de la variable indépendante sur celui de la variable dépendante. L’ordre d’importance est donc le suivant : q112, q113, q111 et q114 mais puisque les coefficients liés à q111 et à q114 ne sont pas significatifs, ces variables doivent être éliminées du modèle.
Il est donc clair que ce qui nous