Mémoire taux d'intérêt sans risque
RAPPORT DU PROJET D’ETUDE EN ANALYSE DE DONNEES
PRESENTE PAR :
Julie CHEA et Kenza BERRADA
Rapport présenté et soutenu à l’université Paris 1 le 04/06/2010 devant le jury composé de :
M. Charles BOUVEYRON
Enseignant à l’université Paris 1
Table des matières
I- Introduction 3
II- Prétraitement des données 4 1. Choix des variables 4 2. Gestion des variables manquantes, aberrantes et extrêmes5 A. Valeurs manquantes 5 a. Indentification des valeurs manquantes5 b. Suppression de ces valeurs6 c. Remplacement de ces valeurs par la moyenne7 B. Valeurs aberrantes7 a. Identification des valeurs aberrantes7 b. Réalité rencontrés8 C. Valeurs extrêmes8
II. Analyse descriptive des données 10 1. Résumé graphique 10 2. Résumé Numérique 11
III. Analyse exploratoire 14 1. Clustering 14 2. Reduction de dimensions 15
IV. Analyse décisionnelle 22 1. Regression 22 2. Analyse prédictive 24
VI. Evaluation des résultats et des méthodes27 1. Taux d’erreur 27 2. Courbe de ROC 27
VII. Conclusion31
ANNEXE 33
I. INTRODUCTION
Le taux de chômage au sens du Bureau International du Travail (BIT) est la proportion du nombre de chômeurs dans la population active, c’est-à-dire les personnes en âge de travailler et qui répondent a ces trois conditions: * être sans emploi, c'est à dire ne pas avoir travaillé, ne serait-ce qu'une heure, durant une semaine de référence. * être disponible pour prendre un emploi dans les 15 jours. * avoir cherché activement un emploi dans le mois précédent ou en avoir trouvé un qui commence dans moins de trois mois.
Depuis les années 1980, la France a été confronté à de nombreuses crises ceci a eu de conséquences graves sur le taux