Ablo Conclusion
45
ou` la variable de ́pendante subsi est le nombre d’abonnements a` la revue i (mesure ́ en logs), et la variable explicative citepricei est le prix annuel d’un abonnement divise ́ par le nombre de citations annuel d’articles publie ́s dans la revue (mesure ́ aussi en logs). Notez que le choix de mesurer les deux variables en logs est celui des auteurs. Nous allons revenir sur cette question dans le chapitre sur les mode`les de re ́gression non line ́aires. 4
Les donne ́es sont dans une banque de donne ́es qui s’appelle ≪ Journals ≫. Il s’agit de donne ́es (avec n = 180) sur les abonnements par des bibliothe`ques universitaires a` des revues scientifiques. La taille de l’e ́chantillon est le nombre de revues dans l’e ́chantillon.
Afin d’effectuer l’estimation d’un mode`le de re ́gression simple de base et afin d’effec- tuer tous les calculs et tous les tests, il faut non seulement la version de base de R mais aussi les ≪ packages ≫ AER (qui contient les donne ́es utilise ́es pour estimer le mode`le), lmtest, sandwich et zoo (ces trois packages permettent de calculer les e ́carts types ro- bustes du mode`le estime ́ et d’effectuer des tests d’hypothe`se utilisant les e ́carts types ro- bustes). Si les packages ne sont pas de ́ja` installe ́s, il faut les installer avec la commande install.packages(·) : install.packages("AER") install.packages("lmtest") install.packages("zoo") install.packages("sandwich")
Notez que sous Linux il est pre ́fe ́rable d’installer le package comme administrateur du syste`me ousuper-utilisateur.Pourlefaire,invoquerlelogicielRaveclacommandesudo R.
Une fois les packages installe ́s, on peut proce ́der a` charger les donne ́es et estimer le mode`le par MCO. Dans le code R qui suit, j’ajoute des commentaires pour expliquer ce que font les
4. Entretemps, a` moins d’avis contraire, je vous demande d’utiliser des variables non transforme ́es dans les exer- cices empiriques.
46