Etude de cas : le dentifrice signal xperience
-------------------------------------------------
ETUDE DE LA TYPOLOGIE DE LA CLIENTELE D’UN FOURNISSEUR D’ACCES A INTERNET.
-------------------------------------------------
(Technique du Scoring)
Sommaire:
INTRODUCTION 4
I/ Traitement des données 5
1° Description de la base de données 5
2° Repérage des données manquantes et aberrantes 6
3° Sélectionner les variable pertinentes quant au thème étudié 6
4° Regrouper des variables 7
5° Choisir les caractéristiques 10
II/ Le soring 19
1° Préparation des tables pour le score 19
2° Le modèle LOGIT : 19 a. Description du modèle retenu: 21 b. Interprétation des caractéristiques 23 c. Validation du modèle 24 d. Vérification et validation du modèle 24
CONCLUSION 26
Annexe 1 : Régression logistique 27
Annexe 2 : Calcul des probabilités pour prévision 39
BIBLIOGRAPHIE 65
Introduction
Le fournisseur d’accès internet est une entreprise qui propose une offre ADSL incluant un accès à internet, la téléphonie fixe et la télévision numérique. Il souhaite définir les différentes variables qui discriminent le plus la variable impayée. Pour ce faire, l’entreprise a réalisé un relevé sur des paiements de facture. Certains ne posent aucun problème, d’autres reviennent en situation d’impayé. La réception d’une ou de plusieurs factures impayées donne lieu à l’ouverture d’un dossier.
Nous avons à disposition un fichier de données contenant des informations relatives à chaque client. Il comprend 8000 données et 17 variables.
La mission que le fournisseur m’a donnée est de réaliser une étude statistique qui déterminera les différentes caractéristiques qui déterminent une situation d’impayé.
Pour cela, on réalise une étude préalable de statistique sur le fichier de données fournis contenant des informations relatives à chaque client afin d’obtenir une base de données exploitable, puis on construit un modèle