Littérature
Il nous faut nous mettre d'accord sur la notion de corpus avant toute analyse
Définition : Définition générale de la notion de corpus
Un corpus est un ensemble de données recueillies pour analyse
En linguistique, deux courants se sont fréquemment opposés
– le courant des partisans des données attestées recueillies sous la forme de corpus à analyser (la grammaire distributionnelle étant prototypique de ce courant);
– le courant des partisans des données construites par un locuteur natif (la grammaire générative étant prototypique de ce courant).
Ce n'est toutefois pas le lieu de discuter des arguments des uns et des autres.
En grammaire distributionnelle, le corpus est un ensemble de données recueillies auprès d'un locuteur natif. Cela peut prendre la forme de textes ou de listes d'énoncés.
Mais cette notion de corpus a beaucoup évolué à partir du début des années 1990 (ce qui correspond à la généralisation des grands réseaux comme l'internet). On a commencé alors à parler de « linguistique de corpus » pour désigner un type d'analyse de corpus à l'aide de l'outil informatique.
Remarque :
Remarque terminologique : alors qu'en français on dira un corpus vs des corpus, en anglais on aura a corpus vs corpora.
En linguistique de corpus, un corpus est constitué de textes, écrits ou oraux. Mais on peut distinguer différents types de textes. Nous allons nous limiter à deux types de textes :
– le type narratif (récit),
– le type argumentatif.
Nous allons nous interroger sur ce qui distingue ces deux types. Autrement dit, nous allons chercher quelles catégories d'information caractérisent chaque type de textes.
Commençons par le type narratif. Vous pouvez lire le texte ci-contre.
Texte narratif
Que constate-t-on à la lecture de ce texte ?
Ce texte comporte :
– le texte commence par une localisation temporelle (« Ce