Modele linéaire généralisé
MASTER Statistique pour l’entreprise
Modèle logistique et scoring
Pierre-André Cornillon et Laurent Rouvière
Université Rennes 2 Place du Recteur H. le Moal CS 24307 - 35043 Rennes Tel : 02 99 14 18 21 Mel : Pierre-Andre.Cornillon@supagro-inra.fr laurent.rouviere@uhb.fr
Table des matières
1 Introduction 1.1 Rappels sur le modèle linéaire . . . . . . . . . . . . . . . . . . 1.2 Analyse discriminante de linéaire (au sens de Fisher ou LDA) 1.2.1 L’analyse discriminante linéaire et quadratique . . . . . 1.2.2 Estimation des paramètres . . . . . . . . . . . . . . . . 1.2.3 Point de vue géométrique . . . . . . . . . . . . . . . . 1.3 Le modèle linéaire généralisé : GLM . . . . . . . . . . . . . . . 1.3.1 La régression logistique . . . . . . . . . . . . . . . . . . 1.3.2 La régression log-linéaire . . . . . . . . . . . . . . . . . 1.3.3 Généralisation : GLM . . . . . . . . . . . . . . . . . . 2 Analyse discriminante logistique 2.1 le modèle logistique . . . . . . . . . . . . . . . . . . . . 2.1.1 Variable explicative continue . . . . . . . . . . . 2.1.2 Facteurs . . . . . . . . . . . . . . . . . . . . . . 2.1.3 Définition générale . . . . . . . . . . . . . . . . 2.1.4 Interprétation des coefficients β . . . . . . . . . 2.2 Rappels sur la méthode du maximum de vraisemblance 2.3 Estimation des paramètres . . . . . . . . . . . . . . . . 2.4 Précision des estimations . . . . . . . . . . . . . . . . . 2.5 Un exemple avec R . . . . . . . . . . . . . . . . . . . . 2.5.1 Modèles “classiques” . . . . . . . . . . . . . . . 2.5.2 Encore d’autres modèles... . . . . . . . . . . . . 3 Sélection et validation de modèles 3.1 Sélection ou choix de modèle . . . . . . . 3.1.1 Un outil spécifique : la déviance . 3.1.2 Critère de choix de modèles . . . 3.1.3 Apprentissage/validation . . . . . 3.1.4 Validation croisée . . . . . . . . . 3.1.5 Sélection automatique . . . . . . 3.2 Validation du modèle . . . . . .