Modèel linéaire contre modèle logistique en regression sur données qualitatives
Philippe Cibois
Département de sociologie,
Université de Versailles - St-Quentin cibois@francenet.fr Abstract. The Linear Model Versus The Logistic Model in Regression on Qualitative Data. Regression on qualitative data is usually done by using a logistic model. By examining data where "everything is otherwise equal" one can show that the linear model is quite compatible with this type of data. Results of an in-deep analysis of cross-tabulation data (called tabular analysis), and of regression using linear and logistic models, are quite similar (in terms of percentage effects). The theoretical question concerning the possibility of a linear model remains to be examined : it seems that the specific situation of a reference category introduces constraints which make the linear model possible. Qualitative Data, Tabular Analysis, Logistic Regression, Linear Regression.
Résumé. La régression sur données qualitatives est habituellement traitée en utilisant un modèle logistique. En examinant des données "toutes choses égales par ailleurs", on montre que le modèle linéaire est tout à fait cohérent avec ce type de données. En comparant les résultats d'une analyse en profondeur des tableaux croisés (appelée analyse tabulaire) avec la régression linéaire et la régression logistique, on constate que ces diverses méthodes donnent des résultats très proches (en termes d'effets en pourcentages). La question théorique de la possibilité du modèle linéaire reste à approfondir : le cas particulier des écarts à une situation de référence introduit des contraintes qui semblent rendre possible l'utilisation du modèle linéaire. Données qualitatives, Analyse tabulaire, Régression logistique, Régression linéaire
La régression sur données qualitatives a d'abord été pratiquée dans des milieux scientifiques qui traitaient des données biologiques, variables quantitatives et qualitatives mélangées :