Économétrie des panels
La régression sur données de panel
I. Définition Les données utilisées en économétrie sont le plus souvent des séries chronologiques, tel le nombre de naissances enregistrées par an dans le département de la Mayenne de 1953 à 2007. On peut à l'inverse disposer de données concernant une période donnée, dites en coupe instantanée, tel le nombre de naissances enregistrées en 1971 dans chacun des départements français. Les données de panel, ou données croisées, possèdent les deux dimensions précédentes et rapportent les valeurs des variables considérées relevées pour un ensemble, ou panel, d'individus sur une suite de périodes. Ainsi la série de panel mesurant la natalité annuelle par département de 1953 à 1997. Remarque : si en marketing ou en statistique, le mot panel désigne généralement un échantillon fixe de consommateurs interrogés à différentes périodes, en économétrie, le terme de données de panel est simplement synonyme de données croisées ayant généralement une dimension temporelle. On utilise une notation naturelle à deux indices : xit note l'observation de la variable x pour l'individu i à la période t. Si on fixe l'individu observé, on obtient la série chronologique, ou coupe longitudinale, le concernant, tandis que si l'on fixe la période examinée, on obtient une coupe transversale, ou instantanée, pour l'ensemble des individus. Il est possible d'envisager des données croisées de plus de deux dimensions, on y reviendra dans l’avant-dernier paragraphe. De nombreux modèles économétriques, notamment dans le domaine des études internationales, peuvent être confrontés à des données croisées, le caractère particulier de celles-ci invite à considérer des spécifications et des méthodes d'estimation adaptées. II. Modèles et méthodes Différents modèles ont été proposés, certains apparaissent également dans d'autres chapitres de l'économétrie et la terminologie n'est pas totalement
2
standardisée. Il convient par suite, lorsqu'on lit un article et plus