Etude de cas : le dentifrice signal xperience

Disponible uniquement sur Etudier
  • Pages : 18 (4306 mots )
  • Téléchargement(s) : 0
  • Publié le : 10 avril 2011
Lire le document complet
Aperçu du document
Etude de cas :

-------------------------------------------------
ETUDE DE LA TYPOLOGIE DE LA CLIENTELE D’UN FOURNISSEUR D’ACCES A INTERNET.
-------------------------------------------------
(Technique du Scoring)

Sommaire:

INTRODUCTION 4

I/ Traitement des données 5
1° Description de la base de données 5
2° Repérage des données manquantes et aberrantes 6
3° Sélectionner lesvariable pertinentes quant au thème étudié 6
4° Regrouper des variables 7
5° Choisir les caractéristiques 10

II/ Le soring 19
1° Préparation des tables pour le score 19
2° Le modèle LOGIT : 19
a. Description du modèle retenu: 21
b. Interprétation des caractéristiques 23
c. Validation du modèle 24
d. Vérification et validation du modèle 24

CONCLUSION26

Annexe 1 : Régression logistique 27
Annexe 2 : Calcul des probabilités pour prévision 39

BIBLIOGRAPHIE 65

Introduction

Le fournisseur d’accès internet est une entreprise qui propose une offre ADSL incluant un accès à internet, la téléphonie fixe et la télévision numérique. Il souhaite définir les différentes variables qui discriminent le plus la variable impayée.

Pource faire, l’entreprise a réalisé un relevé sur des paiements de facture. Certains ne posent aucun problème, d’autres reviennent en situation d’impayé. La réception d’une ou de plusieurs factures impayées donne lieu à l’ouverture d’un dossier.

Nous avons à disposition un fichier de données contenant des informations relatives à chaque client. Il comprend 8000 données et 17 variables.La mission que le fournisseur m’a donnée est de réaliser une étude statistique qui déterminera les différentes caractéristiques qui déterminent une situation d’impayé.

Pour cela, on réalise une étude préalable de statistique sur le fichier de données fournis contenant des informations relatives à chaque client afin d’obtenir une base de données exploitable, puis on construit un modèlequi peut indiquer quelles variables qui caractérisent le mieux une situation d’impayé.


Traitement des données.

I.Description de la base de données

Un fichier sous Excel a été mis à ma disposition. Ce fichier a les enregistrements de 8000 individus, soit un échantillon de 17 variables sur les détails des clients de l’entreprise. Ces variables se répartissent comme suivant :Clé | Clé du client(8000). |
Impayé | La variable Dummy. |
Montant des factures impayées | En euro. |
Etat du dossier | Fermé ou Non. |
Date de fermeture | Date. |
Origine de l'impayé | Client ou Banque. |
NPAI | La variable Dummy. |
Segmentation marketing | Client inactif ou Client peu actif ou Client à fort potentiel. |
Versement du salaire | Début de mois ou fin de mois. |
Banque| Banque Populaire, Crédit Agricole, Crédit Lyonnais, BNP Paribas, Société Générale, Caisse d'Epargne, La Poste, Autre. |
Téléphone | Portable, Fixe, Aucun téléphone. |
Ancienneté du client | Plus de 4 ans, Moins de 4 ans, Moins de 3 ans, Moins de 2 ans, Moins d’un an. |
Prélèvement automatique | La variable Dummy. |
Fichage BDF | La variable Dummy. |
Qui est fiché ? | Titulaire,Conjoint, Les deux, Aucun. |
Sexe | F, M. |
Date de naissance | Date. |
Département | Code de département, 2 chiffres. |

II.Repérage des données manquantes et aberrantes.

Avant de commencer l’analyse des données, j’ai vérifié qu’il y a une donnée aberrantes pour la clé de 1286, parce que ce client a 1111 factures d’impayée avec un montant de 139.1 euros, normalement, ce n’est paspossible, parce que 1111 mois est trop long , plus 92 ans, donc je pense que c’est une de erreur d’ enregistrer, et comparer avec les autres clients dans cette base de donnée, j’ai trouvé dans le cadre de l’état de dossier été mis en « fermé »,donc je décide de changer 1111 fois à 1 fois pour compléter cette base de donnée. Et encore pour la clé 30466, dans la cadre d’impayé, il a affiché « A »,...
tracking img