Analyse multivariée
Stéphane DRAY Laboratoire de Biométrie et Biologie Evolutive Université Claude Bernard Lyon I, Bat G. Mendel 69622 Villeurbanne Cedex, FRANCE email : dray@biomserv.univ-lyon1.fr
Résumé : L’identification de structures spatiales induisant plusieurs variables est une problématique récurrente dans de nombreux domaines d’application. Cet article présente quelques aspects permettant la prise en compte de l’espace lors de l’analyse de données multivariées. Une illustration basée sur des données socio-économiques est proposée. Mots clés : analyse en composantes principales, analyse de données, structure spatiale multivariée
1. Introduction
Selon Poidevin [21], près de 85 % des bases de données contiennent un composant géographique associé à un lieu précis. Cette masse « astronomique » de données spatialisées a entraîné un fort développement de l’utilisation des systèmes d’information géographique (SIG) dans de nombreux domaines d’activités tels que l’environnement, l’agriculture, le marketing, les transports ou la gestion du territoire. L’efficacité des SIG pour stocker, gérer, manipuler, analyser, modéliser, représenter des données à références spatiales n’est plus à démontrer. Parmi les fonctionnalités de base d’un SIG, la cartographie thématique est un outil d’analyse, d’aide à la décision et de communication largement utilisée pour représenter quelques variables : une bonne carte vaut mieux qu’un long discours. Lorsque l’on s’intéresse à des phénomènes impliquant plus de deux variables, il est difficile de représenter l’ensemble de l’information. La rédaction d’une seule carte conduit à des objets surchargés dont la lisibilité est réduite. La rédaction de plusieurs cartes rend difficile l’identification de corrélations et de structures communes (figure 1). Le besoin d’outils permettant d’obtenir des variables synthétiques résumant l’information disponible se fait alors ressentir. C’est précisément l’objectif de