Analyse financière
Thierry Verdel (2007)
Chapitre 7
La régression linéaire
Les sciences exactes sont fondées sur la notion de relations répétables, qui peut s’énoncer ainsi : dans les mêmes conditions, les mêmes causes produisent les mêmes effets. Notant alors x la mesure des causes, et y celle des effets, la liaison entre y et x s’écrit suivant la relation fonctionnelle y = fc HxL : à une valeur donnée de x correspond une valeur bien déterminée de y. Or, pour de nombreux phénomènes (notamment industriels), une étude exhaustive de tous les facteurs est impossible, à cause de leur grand nombre ou de leur complexité. Il en résulte que la reproductibilité des conditions, d’une expérience à une autre, ne peut être garantie. Partant de cette constatation, la statistique va permettre d’étendre la notion de relation fonctionnelle répétable, à celle de corrélation où la relation entre x et y est entachée d’une certaine dispersion due à la variabilité des conditions d’expérience : on écrira y = f HxL + ! , où ! est une variable aléatoire.
Chapitre 7 : La régression linéaire
107
1. La droite des moindres carrés
1.1. Nuage des individus
Le problème est d’étudier l’influence d’une variable quantitative X sur une autre variable quantitative Y . La première est souvent appelée variable explicative (ou encore exogène) et la seconde est appelée variable expliquée (ou encore endogène). Pour résoudre ce problème, on a réalisé une expérimentation qui consiste à prélever un échantillon de n individus, et à mesurer sur chacun d’eux les valeurs prises par chacune des deux variables. En vue, par exemple, d’étudier l'influence de la teneur en carbone d’un acier sur sa résistance à la traction, on a procédé à la mesure de ces deux variables sur 100 éprouvettes. On dispose donc d’un échantillon de n couples d'observations Hxi , yi L que l’on peut représenter sur un graphique, dans le plan !2 , où chaque point i, d’abscisse xi et d’ordonnée yi ,