Correction contrôle de la non-réponse par imputation
Thomas Deroyon & Cyril Favre-Martinoz
Résumé — L’objectif de cette note méthodologique est de décrire de façon rapide le principe de la correction de la non- réponse par imputation et les méthodes les plus fréquemment utilisées pour la mettre en oeuvre.
I. RAPPELS SUR LES SONDAGES ALÉATOIRES
Les enquêtes de la statistique publique sont réalisées sur des parties de la population totale des ménages ou des entreprises, appelées échantillons, …afficher plus de contenu…
Relèvent de ce groupe les méthodes d’imputation avec résidu et le hotdeck aléatoire.
Il est également possible de classer les méthodes d’impu- tation en distinguant :
I les méthodes par donneur : la valeur utilisée pour l’imputation est la réponse fournie par un répondant à l’enquête. Figurent dans ce groupe l’imputation par le plus proche voisin et l’imputation par hotdeck ;
I les méthodes par valeur prédite : la valeur imputée n’est pas basée sur la réponse d’un seul répondant, mais mélange informations externes à l’enquête et réponses de plusieurs répondants.
B. Les méthodes déterministes α . L’imputation …afficher plus de contenu…
Elle est souvent utilisée dans les enquêtes auprès des entreprises pour imputer l’effectif salarié d’une entreprise ou le secteur lorsque ceux-ci sont demandés au début d’un questionnaire comme données de cadrage, en utilisant les valeurs renseignées dans le répertoire d’entreprises Sirene. Cette méthode suppose l’existence d’une source externe fiable, dans laquelle la variable à imputer est disponible et mesurée sur une période et suivant une méthode et des concepts proches de ceux de l’enquête. γ . L’imputation par la moyenne ou par la médiane
Cette méthode consiste à remplacer la valeur man- quante par la moyenne ou la médiane des réponses à cette variable fournies par les répondants. La