Analyse discriminante

Disponible uniquement sur Etudier
  • Pages : 6 (1371 mots )
  • Téléchargement(s) : 0
  • Publié le : 4 décembre 2011
Lire le document complet
Aperçu du document
Définition 

L'analyse discriminante se présente selon deux perspectives complémentaires. La première est descriptive: il s'agit d'une technique statistique qui vise à identifier des variables (X1, X2, X3…) permettant de différencier les individus qui appartiennent à l’un ou l’autre de deux groupes (ou plus). La deuxième perspective est prédictive: après avoir identifié un certain nombre devariables dont la puissance discriminative est satisfaisante, il est possible d'utiliser une ou plusieurs fonctions discriminantes issues de ces variables pour tenter de classifier les unités observées dans les différents groupes. Ultimement, les fonctions discriminantes peuvent même être réutilisées auprès d'un nouvel échantillon de sujets en ayant cette fois comme objectif de prédire l'appartenancedes nouveaux participants à l'un ou l'autre des groupes ciblés.

On voit donc que la première condition qui doit être rencontrée pour mener une analyse discriminante est l'existence d'au moins deux groupes bien définis dans la population d'intérêt, comme par exemple le fait que certains détenus fassent partie d'un groupe manifestant de l'inconduite, alors que d'autres détenus n'en fassent paspartie. Idéalement, la séparation entre les groupes devrait être faite sur la base d'un critère qualitatif et ne devrait pas correspondre à une simple variation d'intensité sur un continuum. Si jamais les groupes sont classifiables sur un continuum quelconque, il devrait alors y avoir des points de coupure ou des zones de séparation naturelle importantes entre les différents groupes. De touteévidence les catégories doivent être exhaustives et mutuellement exclusives, c'est à dire que toutes les unités d'observations doivent appartenir à une seule catégorie et qu'elles doivent toutes être classifiées. Enfin, les groupes doivent être connus et définis à l'avance et en ce sens l'analyse discriminante n'est pas une technique visant à révéler l'existence de groupes dont on ne connaîtrait pasdéjà l'existence avant d'entreprendre l'analyse. L'un des grands défis de l'analyse discriminante concerne justement la sélection des variables discriminatrices; c’est le but de la perspective descriptive.

La perspective descriptive

D'un point de vue purement descriptif l'analyse discriminante est tout à fait identique à l'analyse de variance multivariée. En effet, si vous inversez simplement lescatégories de variables X et Y (indépendantes vs dépendantes), vous obtenez deux analyses statistiques absolument équivalentes en termes de modèles statistiques sous-jacents. On pourrait dire que l'analyse discriminante vise à utiliser des combinaisons de variables X1, X2, X3 pour prédire l'appartenance à des groupes définis par les niveaux d'une variable dépendante Y, alors qu'en analyse devariance multivariée, on utilise un facteur de groupes X (variable indépendante) pour vérifier si ces groupes sont différents les uns des autres sur une combinaison de variables dépendantes Y1, Y2, Y3.
Étant donné que plusieurs variables X sont disponibles pour discriminer les groupes et que ces variables peuvent être plus ou moins corrélées entre elles, l'analyse discriminante procédera au calcul descores composites un peu de la même façon que nous l'avions décrit dans la section traitant de l'analyse de corrélation canonique. Ces scores composites issus des variables prévisionnelles X sont d'ailleurs appelés ici des fonctions canoniques discriminantes. Les fonctions canoniques discriminantes sont calculées de manière à maximiser les différences entre les groupes que l'on cherche àdiscriminer. Si les variables utilisées dans l'analyse ont été bien choisies et qu'elles recèlent un bon pouvoir de discrimination, elles donneront lieu à l'émergence d'une fonction discriminante sur laquelle les membres d'un même groupe auront des scores relativement semblables, alors que les membres de groupes différents obtiendront sur la même fonction discriminante des scores relativement...
tracking img