Les modèles de regression

Pages: 192 (47767 mots) Publié le: 10 janvier 2013
´ ´ ` ´ Resume du Cours de Modeles de Regression
Yves Till´ e 10 janvier 2011

1

Chapitre 1

R´gression bivari´e e e
1.1 S´rie statistique bivari´e e e

On s’int´resse ` deux variables x et y. Ces deux variables sont mesur´es sur les n unit´s d’observation. e a e e Pour chaque unit´, on obtient donc deux mesures. La s´rie statistique est alors une suite de n couples des e e valeurs prises parles deux variables sur chaque individu : (x1 , y1 ), . . . , (xi , yi ), . . . , (xn , yn ). Chacune des deux variables peut ˆtre soit quantitative, soit qualitative. e

1.1.1

Repr´sentation graphique de deux variables e

Dans ce cas, chaque couple est compos´ de deux valeurs num´riques. Un couple de nombres (entiers ou e e r´els) peut toujours ˆtre repr´sent´ comme un point dans un plan e e e e(x1 , y1 ), . . . , (xi , yi ), . . . , (xn , yn ). Exemple 1.1 On mesure le poids Y et la taille X de 20 individus. Table 1.1 – Taille et poids de 20 individus yi 60 61 64 67 68 69 70 70 72 73 xi 155 162 157 170 164 162 169 170 178 173 yi 75 76 78 80 85 90 96 96 98 101 xi 180 175 173 175 179 175 180 185 189 187

1.1.2

Analyse des variables

Les variables x et y peuvent ˆtre analys´es s´par´ment.On peut calculer tous les param`tres dont les e e e e e moyennes et les variances : n n 1∑ 1∑ x= ¯ xi , s2 = (xi − x)2 , ¯ x n i=1 n i=1 2

poids

60 155

70

80

90

100

160

165

170 taille

175

180

185

190

Figure 1.1 – Le nuage de points 1∑ yi , n i=1
n

y= ¯

s2 = y

1∑ (yi − y )2 . ¯ n i=1
n

Ces param`tres sont appel´s param`tres marginaux : variances marginales, moyennes marginales,´carts-types e e e e marginaux, etc.

1.1.3

Covariance
sxy = 1∑ (xi − x)(yi − y ). ¯ ¯ n i=1
n

La covariance est d´finie e

Remarque 1.1 – La covariance peut prendre des valeurs positives, n´gatives ou nulles. e – Quand xi = yi , pour tout i = 1, . . . n, la covariance est ´gale ` la variance. e a – La covariance peut ´galement s’´crire e e sxy = 1∑ xi y i − xy . ¯¯ n i=1
n

1.1.4

Corr´lation esxy . sx sy

Le coefficient de corr´lation est la covariance divis´e par les deux ´cart-types marginaux e e e rxy =

Le coefficient de corr´lation peut ˆtre interpr´t´ g´om´triquement. Consid´rons les deux vecteurs centr´s de e e ee e e e e Rn : ˜ x = (x1 − x, · · · , xi − x, · · · , xn − x)′ ¯ ¯ ¯ ˜ y = (y1 − y , · · · , yi − y , · · · , yn − y )′ . ¯ ¯ ¯ ˜ ˜ Par d´finition, le cosinus de l’angleentre, x et y vaut e cos(˜ , y) = x ˜ ˜ ˜ < x, y > , ||˜ || × ||˜ || x y 3

˜ ˜ o` < x, y > est le produit scalaire entre les vecteurs x et y u ˜ ˜ ˜ ˜ < x, y >= ˜ ˜ et ||˜ || (rep. ||˜ ||) est la norme de x (resp. y) : x y ||˜ || = x
n ∑ i=1 n ∑ i=1

(xi − x)(yi − y ), ¯ ¯

(xi − x)2 et ||˜ || = ¯ y

n ∑ i=1

(yi − y )2 . ¯

˜ ˜ Le coefficient de corr´lation est donc ´gal au cosinus de l’angle entreles vecteurs x et y. Comme un cosinus e e est toujours compris dans [−1, 1], on obtient que : −1 ≤ rxy ≤ 1. (1.1)

Remarque 1.2 Le coefficient de corr´lation mesure la d´pendance lin´aire entre deux variables. e e e – Si le coefficient de corr´lation est positif, les points sont align´s le long d’une droite croissante. e e – Si le coefficient de corr´lation est n´gatif, les points sont align´s le longd’une droite d´croissante. e e e e – Si le coefficient de corr´lation est nul ou proche de z´ro, il n’y a pas de d´pendance lin´aire. On peut e e e e cependant avoir une d´pendance non-lin´aire avec un coefficient de corr´lation nul. e e e
r=1 r=−1 r=0

r>0

r<0

r=0

Figure 1.2 – Exemples de nuages de points et coefficients de corr´lation e

Remarque 1.3 La pr´sence d’une corr´lation n’implique pasforc´ment une relation de causalit´ entre les e e e e deux variables. Le coefficient de d´termination (appel´ aussi R-deux ou R-carr´) est le carr´ du coefficient de corr´lation. e e e e e
2 rxy =

s2 xy . s2 s2 x y

De l’in´galit´ (1.1), on obtient directement que e e
2 0 ≤ rxy ≤ 1.

4

1.1.5

Droite de r´gression e

La droite de r´gression est la droite qui ajuste au mieux un nuage de points au sens...
Lire le document complet

Veuillez vous inscrire pour avoir accès au document.

Vous pouvez également trouver ces documents utiles

  • Econométrie: modèle de régression simple
  • modèle de régression multiple
  • Modèel linéaire contre modèle logistique en regression sur données qualitatives
  • régression
  • La régression multiple
  • Analyse de la regression
  • Modèles de réseaux de neurones pour l’analyse des séries temporelles ou la régression : Estimation, Identification, Méthode...
  • Regression linéaire

Devenez membre d'Etudier

Inscrivez-vous
c'est gratuit !