REGRESSION SIMPLE S6
1. Régression linéaire simple
Maintenant on se place dans le cas général, on a plusieurs séries :
La série X : X1 X2 …Xi ... Xn on note la moyenne de X=1/n*
La série Y : Y1 Y2 …Yi ... Yn on note la moyenne de Y=1/n*
La série des estimations Yest notée aussi = α + ß * X : 1 2 .. i .. n
La série des résidus .ε: ε 1 ε 2 … ε i ... ε n
Y = α +β *X + ε = + ε et pour tout i allant de 1 à n Yi = α +β *Xi + εi = i + εi Si on considère le nuage de point suivant, effectuer une régression linéaire sur ce nuage consiste à le remplacer par une droite comme ci-dessous.
Les points bleus sont les Yi et les points sur la droite sont les valeurs des Yest, Y estimés i, comme nous l’avons vu au chapitre précédent, les termes d’erreurs sont leur différence soit la distance verticale entre chaque point bleu et la droite.
L’estimation sera d’autant meilleure que le nuage de points bleus est proche de la droite, ce qui signifie que la somme des écarts des distances des points bleus à la droite, c'est-à-dire la somme des carrés des erreurs, doit être le plus petit possible :
-On cherche donc le minimum de n est le nombre d’observations. C’est le principe des MCO.
-En outre on se souvient que la moyenne des résidus =0
2-Résolution des MCO:
La solution des MCO est
= *
Exercice : Excel ‘Econométrie-présentation’
Revenir au graphe précédent sous Excel. La droite D est égale au produit d’un coefficient β et de la série X. Calculez dans une cellule la somme des carrés des résidus, .
Faites varier β de 0,6 à 1,2 et plus essayez de repérer quelle valeur de β correspond au minimum de.
3- Propriétés des résidus :
εi suit une loi normale centrée réduite
Le terme aléatoire ε tient un rôle très important dans la régression. Il permet de résumer toute l'information qui n'est pas prise en compte dans la relation linéaire que l'on cherche à établir entre Y et