Analyse
S.Turolla
Note 2 - Modèle de régression linéaire simple
Soit le modèle de régression linéaire suivant :
y i = β 1 + β 2 x i + εi
i = 1, . . . , n
1 Hypothèses sur le modèle de régression linéaire simple
H.1 Linéarité : La relation entre la variable expliquée yi et la variable explicative xi est linéaire H.2 Exogénéité de la variable explicative : La variable explicative n'intervient pas dans la prédiction des εi
E [εi |xi , xi , . . . , xi ] = 0
H.3 Nullité de l'espérance des erreurs :
E (εi ) = 0
L'espérance des aléas est nulle
i = 1, . . . , n
Les aléas sont homoscédastiques1
H. 4 Homoscédasticité et absence d'autocorrélation : et non autocorrélés, autrement dit 1. leur variance est constante
V (εi ) = E [εi − E (εi )]2 = E (εi )2 = σ 2
2. leur covariance est nulle
COV (εi , εj ) = E [[εi − E (εi )] [εj − E (εj )]] = E (εi , εj ) = 0
Corollary 1 Si les hypothèses 1 et 2 sont vériées alors l'aléa ε est un bruit blanc. H.5 Données générées de manière exogène
(xi1 , xi2 , . . . , xin ) est indépendant de celui qui génère εi .
: Le processus ayant généré les données Les observations
H.6 Hétérogénéité entre les observations de la variable explicative :
(xi1 , xi2 , . . . , xijn ) ne sont pas toutes identiques, ainsi la variance empirique des xi est non nulle.
On parle d'homoscédasticité lorsque la variance d'un processus est constant. Si la variabilité des erreurs ne uctuent pas entre observations (ex. le revenu pour les ménages nombreux), alors les erreurs sont dites homoscédastiques
1
2 Estimateur des Moindres Carrés Ordinaires (M.C.O.)
L'estimateur des MCO est dérivée de la minimisation de la somme des carrés des aléas M in On obient d'après les C.P.O : n i=1 (xi − x) (yi − n 2 i=1 (xi − x) n 2 i=1 εi .
β2 =
2.1
y)
et β 1 = y − β 2 x
Propriétés de l'estimateur des MCO
Sous les hypothèses H.1 à H.6, l'estimateur des MCO est Best Linear