choix du conjoint
F0505
Homogamie et choix du conjoint
Traitement de la non-réponse
Imputation de variables qualitatives corrélées
Mélanie VANDERSCHELDEN
Document de travail
INSTITUT NATIONAL DE LA STATISTIQUE ET DES ÉTUDES ÉCONOMIQUES
Série des Documents de Travail de la
DIRECTION DES STATISTIQUES DEMOGRAPHIQUES ET SOCIALES
Département de la Démographie
N°F0505
Homogamie et choix du conjoint Traitement de la non-réponse
Imputation de variables qualitatives corrélées
Mélanie VANDERSCHELDEN
(Division des Etudes Démographiques)
Mai 2005
Ces documents de travail ne reflètent pas la position de l’INSEE et n’engagent que leurs auteurs.
Working-papers do not reflect the position of INSEE but only their authors’views.
Homogamie et choix du conjoint Traitement de la non-réponse
Imputation de variables qualitatives corrélées
Résumé
Lorsque des individus enquêtés n’ont pas répondu à un nombre important de questions, il est possible d’assimiler les observations correspondantes à de la non-réponse totale. Celle-ci est alors corrigée par repondération des autres observations. Pour corriger la non-réponse partielle (quelques variables non renseignées), il existe différentes méthodes d’imputation par substitution. Les imputations indépendantes par hot-deck séquentiel, faciles à mettre en œuvre et efficaces dans le cas de variables à imputer peu nombreuses et indépendantes, ne sont pas idéales lorsqu’il s’agit d’imputer une dizaine de variables potentiellement corrélées. Il est possible, avec le hot-deck aléatoire, de choisir un donneur unique pour imputer simultanément les différentes variables manquantes pour une même observation, ce qui permet de tenir compte des éventuels liens entre variables à imputer. La constitution de classes d’imputation permet de choisir un donneur parmi des personnes de caractéristiques proches, mais ne permet pas de rationaliser au maximum ce choix. Le hot-deck métrique, qui consiste à choisir le donneur