Le rivage des syrtes, gracq
Qui n'a été frappé à la lecture du roman le plus célèbre de Gracq par l'effet de surprise que constitue la rareté de son vocabulaire [1] ? Aujourd'hui le logiciel Hyperbase [2] permet non seulement d'y avoir un accès immédiat par interrogation de mot-clé (c'est là l'avantage pratique le plus visible du texte numérisé), mais aussi de disposer de statistiques lexicales, lesquelles servent à objectiver la sélection de ces mots vedettes par lesquels on décide d'entrer dans le roman.
Voici à titre de couleur initiale du roman la liste des 50 premiers mots statistiquement les plus spécifiques [3], par ordre décroissant – hormis les noms propres, les mots grammaticaux, et les verbes d'incises ("ajouta, reprit, dit"), écartés parce qu'ils ne sont pas indexés à des domaines sémantiques, non en raison d'un sens vide : Amirauté - voix - Seigneurie - forteresse - sent(a)is - yeux - vieillard - capitaine - lagune(s) - observateur - regard - navire - sembla(it) - redoutable - geste - chose(s) - palais - mer - visage - pouvais - instructions - soudain - maintenant - bateau - affaire - passerelle - lanterne - remarquai - sables - légèrement - conseil - sourire - nuit - silence - jetai - voulais - compris - posa - tête - joncs - miens - surveillance - savais - fièvre - cartes - police - humeur - ensommeillée - gens - imperceptiblement
Or entre ce type de données lexicales et l'abord de la textualité, il apparaît que le chaînon manquant est bien la contextualisation des mots, dont la chaîne de caractères n'acquiert de contenu sémantique réel qu'à cette condition. Bref, par rapport aux requêtes logicielles, ce n'est qu'a posteriori que s'établit leur portée thématique, pour laquelle l'analyste ne peut se passer de parcours interprétatifs [4].
Certes en rapprochant dans cette liste par exemple "lagune(s) – mer – sables – silence – joncs" on dessine un espace désertique révélateur de "cette