Modéle durée
Série des Documents de Travail 'Méthodologie Statistique
N°9702
MODELES UNIVARIES ET MODELES DE DUREE
sur données individuelles
S. LOLLIVIER
Cette note s’inspire pour partie d’un travail réalisé au CREST en collaboration avec C.Casès. Il a également bénéficié des remarques de D.Verger. Toute suggestion est bienvenue en vue d’une version ultérieure.
Ces documents de travail ne reflètent pas la position de l'INSEE et n'engagent que leurs auteurs.Working papers do not reflect the position of INSEE but only their authors views.
Modèles univariés et Modèles de durée
1
RESUME Ce document est consacré à l’étude des modèles dans lesquels la variable expliquée est soumise à une troncature. Sous un formalisme analogue, ces modèles recouvrent deux grands domaines. Le premier s’intéresse aux modèles pour lequel la variable est observée sous forme d’une système de tranches, le cas échéant sur une partie de l’échantillon, le complément étant observé en clair. Un cas particulier est celui du modèle Tobit simple, dans lequel la variable est observée en clair seulement en dessous d’un certain seuil. On rencontre ce type de situation lorsque l’on a souhaité simplifier la collecte de l’information, par exemple questionner les individus sur une variable sensible sous forme d’un système de tranches plutôt qu’en clair. Le deuxième domaine d’application est celui des modèles de durée. La particularité de ces modèles est de s’intéresser à des variables positives, soumises éventuellement à un phénomène de censure lorsque la durée n’est que partiellement observée. Dans le texte sont décrits ces différents modèles, leur formalisme, et le moyen de les estimer avec le logiciel SAS. On s’intéresse enfin aux biais introduits par la sélection endogène, qui peuvent apparaitre lorsque les durées sont observées à partir de fichiers de stock. C’est par exemple le cas lorsque l’on réalise un suivi des chômeurs à