La régression multiple
Destiné à de futurs thématiciens, notamment géographes, le présent exposé n’a pas pour vocation de présenter la théorie de l’analyse des données par régression au sens statistique du terme. Pour cela nous renvoyons aux nombreux ouvrages rédigés par les statisticiens eux-mêmes. Le but recherché ici est de proposer des exemples concrets de traitement ayant fait appel à l’analyse par régression linéaire multiple selon différentes logiques a priori éloignées les unes des autres. Nous verrons successivement comment la méthode des régressions linéaires multiples permet : d’analyser les liens entre une variable dépendante quantitative à expliquer et plusieurs variables quantitatives explicatives indépendantes comme on l’admet généralement ; de déterminer les équations d’un ajustement polynomial non-linéaire pour l’analyse des liens entre deux variables quantitatives ; de déterminer les équations de surfaces de tendances ; d’analyser la rugosité du relief ; de déterminer les équations polynomiales d’un modèle de correction géométrique applicable à des vecteurs et/ou des données raster.
1. RÉGRESSION LINÉAIRE : LES PRINCIPES
L’analyse descriptive des données repose sur une démarche en plusieurs étapes. On définit tout d’abord les caractéristiques des variables prises une à une (analyse univariée ou tri à plat), puis on observe les liens qui les caractérisent deux par deux (analyse bivariée ou tri
croisée) pour finir par l’observation des structures multiples liant plusieurs variables (analyse multivariée). On distingue alors deux familles principales, la première consiste à observer les liens unissant une variable avec plusieurs autres (1 n), la seconde considère n, analyse
simultanément les structures multiples liant différentes variables (n
factorielle). Selon la nature des variables retenues les méthodes de