La régression multiple

Pages: 20 (4854 mots) Publié le: 26 mars 2012
Régression multiple : principes et exemples d’application Dominique Laffly UMR 5 603 CNRS Université de Pau et des Pays de l’Adour Octobre 2006

Destiné à de futurs thématiciens, notamment géographes, le présent exposé n’a pas pour vocation de présenter la théorie de l’analyse des données par régression au sens statistique du terme. Pour cela nous renvoyons aux nombreux ouvrages rédigés par lesstatisticiens eux-mêmes. Le but recherché ici est de proposer des exemples concrets de traitement ayant fait appel à l’analyse par régression linéaire multiple selon différentes logiques a priori éloignées les unes des autres. Nous verrons successivement comment la méthode des régressions linéaires multiples permet : d’analyser les liens entre une variable dépendante quantitative à expliquer etplusieurs variables quantitatives explicatives indépendantes comme on l’admet généralement ; de déterminer les équations d’un ajustement polynomial non-linéaire pour l’analyse des liens entre deux variables quantitatives ; de déterminer les équations de surfaces de tendances ; d’analyser la rugosité du relief ; de déterminer les équations polynomiales d’un modèle de correction géométriqueapplicable à des vecteurs et/ou des données raster.

1. RÉGRESSION LINÉAIRE : LES PRINCIPES
L’analyse descriptive des données repose sur une démarche en plusieurs étapes. On définit tout d’abord les caractéristiques des variables prises une à une (analyse univariée ou tri à plat), puis on observe les liens qui les caractérisent deux par deux (analyse bivariée ou tri

croisée) pour finir parl’observation des structures multiples liant plusieurs variables (analyse multivariée). On distingue alors deux familles principales, la première consiste à observer les liens unissant une variable avec plusieurs autres (1 n), la seconde considère n, analyse

simultanément les structures multiples liant différentes variables (n

factorielle). Selon la nature des variables retenues les méthodes de calculseront différentes mais la logique reste la même. L’analyse par régression linéaire multiple est une des solutions qui existe pour observer les liens entre une variable quantitative dépendante et n variables quantitatives indépendantes.

Toutes méthodes faisant appel aux régressions reposent sur l’acceptation des hypothèses fondatrices de la statistique paramétrique1 et la notion d’ajustementpar les moindres carrés. La moyenne arithmétique d’une variable est par conséquent considérée comme un centre de gravité et la notion des moindres carrés consiste à minimiser la somme des résidus élevés à la puissance deux entre la valeur observée et celle extrapolée.

1.1. Régression linéaire simple

Un exemple simple d’ajustement par les moindres carrés est donné par l’analyse bivariée devariables quantitatives qui peut se simplifier par le calcul des variances et de la covariance des deux variables X et Y retenues.

La variance répond à la formule suivante :

où :

n, nombre d’individus xi, valeur de la variable x pour l’individu i
x , moyenne arithmétique de la variable x

Pour simplifier à l’extrême, la statistique paramétrique repose sur l’hypothèse que les données sontdes variables indépendantes distribuées selon une loi normale.

1

La covariance considère les variations communes des deux variables selon la formule :

CovXY =

1 N

∑ (x
n i =1

i

− x * yi − y

)(

)

où :

n, nombre d’individus xi, valeur de la variable x pour l’individu i
x , moyenne arithmétique de la variable x

yi, valeur de la variable x pour l’individu i
y ,moyenne arithmétique de la variable y

Enfin, le coefficient de corrélation est donné par la formule :

Ceof .cor =

CovXY VarX * VarY

Le coefficient de corrélation correspond au cosinus de l’angle formé entre deux droites de régression se croisant aux coordonnées des moyennes arithmétiques des deux variables observées (centre de gravité supposé). On définit donc deux droites répondant...
Lire le document complet

Veuillez vous inscrire pour avoir accès au document.

Vous pouvez également trouver ces documents utiles

  • Regression multiple
  • La régression multiple
  • Etude de cas régression multiple
  • La regréssion linéaire multiple
  • modèle de régression multiple
  • REGRESSION LIN AIRE MULTIPLE
  • régression
  • Analyse de la regression

Devenez membre d'Etudier

Inscrivez-vous
c'est gratuit !