Résumé
Gilbert Saporta
Chaire de Statistique Appliquée Conservatoire National des Arts et Métiers http://cedric.cnam.fr/~saporta
ENG200, octobre 2011
1
ENG200, octobre 2011
2
Peut–on tout faire dire aux chiffres?
• La statistique : une discipline rigoureuse qui traite de l’incertain et du variable! • Maitriser l’aléatoire dans un monde non déterministe
ENG200, octobre 2011
3
Plan
1. Définitions 2. Comment recueillir les données 3. Inférence et modélisation 4. Le “data mining” 5. Construction et choix de modèles 6. Conclusions
ENG200, octobre 2011
4
"La statistique"
Rapport sur la science et la technologie n°8 Académie des sciences, Août 2000 -
ENG200, octobre 2011
5
1. Définitions
• La statistique et les statistiques
– les statistiques: recueils de données, résultats élémentaires – la statistique: méthodologie du recueil, du traitement, de l’interprétation de données statistiques
• Individus et variables
– individus, observations, unités… – variables ou caractères
ENG200, octobre 2011 6
• Individus et variables
– les individus appartiennent à une population, échantillon : partie observée
• Nature des variables
– numériques ou quantitatives: valeurs – qualitatives : modalités, catégories, niveaux
ENG200, octobre 2011
7
ENG200, octobre 2011
8
• Statistique exploratoire et statistique inférentielle
– statistique exploratoire: description des données à l’aide de graphiques, tableaux, résumés – statistique inférentielle: extrapolation, modélisation, prévision...
ENG200, octobre 2011
9
2. Le recueil des données
• Inférence: passer du particulier (l’observé) au général (population) • Nécessité de bien choisir les observations • Deux grandes méthodologies:
– sondages (ou échantillonnage) – expérimentation planifiée
ENG200, octobre 2011
10
2.1 Les sondages (dans une population finie)
• Objectif: estimer une quantité (moyenne, total, proportion)