L'affaire moliere corneille
L'idée fait des vagues, la polémique enfle tout au long du XXe siècle. Les partisans de cette supercherie jugent la ressemblance lexicale entre les pièces de Molière et celles de Corneille trop grande pour être le fruit du hasard. De plus, Molière n'a laissé aucun manuscrit, pas un brouillon, pas une note. Et surtout comment un petit comédien aurait pu se transformer subitement, à trente-sept ans, en un auteur de la dimension de Molière ?
La réponse venue des stats
En 2003, Dominique Labbé annonce avoir résolu cette énigme littéraire à l'aide d'outils statistiques. Chercheur spécialisé dans les statistiques appliquées aux langages, il a mesuré la distance intertextuelle entre deux textes, ou (en résumé) la somme des différences entre les fréquences des mots des deux textes. Cette distance permet d'obtenir une mesure entre 0 (si tous les mots sont employés dans deux textes à la même fréquence) et 1 (si les textes ne partagent aucun mot en commun).
"La ressemblance lexicale entre les pièces de Molière et de Corneille est trop grande pour être ldûe au hasard"
De nombreuses précautions sont nécessaires, comme respecter une taille suffisante de texte, différencier les homonymes, repérer tous les genres d'un même mot… Mais finalement, après un étalonnage sur de nombreux textes, Labbé conclut que deux textes dont la distance intertextuelle est inférieure ou égale à 0,20 sont forcément du même auteur. Entre 0,20 et 0,25, ils sont probablement du même auteur. Au-dessus de 0,40 les deux auteurs sont certainement différents.
Et ses conclusions concernant l'affaire Molière/Corneille sont formelles : les textes de Molière sont des écrits de Corneille. En effet, leur distance