corpus
Un corpus est un ensemble de documents, artistiques ou non (textes, images, vidéos, etc.), regroupés dans une optique précise. On peut utiliser des corpus dans plusieurs domaines : études littéraires, linguistiques, scientifiques, philosophie1, etc.
Sommaire [masquer]
1 Le corpus en linguistique
2 Le corpus en littérature
3 Le corpus dans la science 3.1 Corpus bien formé 3.1.1 Taille
3.1.2 Langage
3.1.3 Temps couvert par les textes du corpus
3.1.4 Registre de langage
3.2 Méthodologie
3.3 Corpus parallèles et corpus comparables 3.3.1 Corpus parallèles
3.3.2 Corpus comparables
4 Autres sens
5 Notes et références
6 Voir aussi 6.1 Articles connexes
6.2 Liens externes
6.3 Bibliographie
Le corpus en linguistique[modifier | modifier le code]
La branche de la linguistique qui se préoccupe plus spécifiquement des corpus s'appelle logiquement la linguistique de corpus. Elle est liée au développement des systèmes informatiques, en particulier à la constitution de bases de données textuelles. Depuis 2001, la revue universitaire CORPUS est dédiée à l'objet.
On parle de corpus pour désigner l'aspect normatif de la langue : sa structure et son code en particulier. "Corpus" est généralement opposé à "status" (ou statut), qui correspond aux conditions d'utilisation de la langue. Cette opposition est commune dans l'étude des politiques linguistiques.
Le corpus en littérature[modifier | modifier le code]
Le corpus regroupe un ensemble de textes ayant une visée commune. Un corpus peut être constitué de documents différents (tableau, extrait de texte...) et ces documents divers ont un point en commun. En général, c'est le thème qui fait figure de leur ressemblance. Il faut avoir une technique particulière pour le déchiffrer.
Le corpus dans la science[modifier | modifier le code]
Les corpus sont des