question de corpus

278 mots 2 pages
Le corpus regroupe un ensemble de textes ayant une visée commune. Un corpus peut être constitué de documents différents (tableau, extrait de texte...) et ces documents divers ont un point en commun. En général c'est le thème qui fait figure de leur ressemblance. Il faut avoir une technique particulière pour le déchiffrer.
Plusieurs caractéristiques sont à prendre en compte pour la création d'un corpus bien formé :

la taille ; le langage du corpus ; le temps couvert par les textes du corpus ; le registre ;
Le corpus doit évidemment atteindre une taille critique pour permettre des traitements statistiques fiables. Il est impossible d'extraire des informations fiables à partir d'un corpus trop petit
Le temps joue un rôle important dans l'évolution du langage : le français parlé aujourd'hui ne ressemble pas au français parlé il y a 200 ans ni, de façon plus subtile, au français parlé il y a 10 ans, à cause notamment des néologismes. C'est un phénomène à prendre en compte pour toutes les langues vivantes. Un corpus ne doit donc pas contenir de textes rédigés à des intervalles de temps trop larges, ou il doit les dater (pour un usage par les historiens de la langue ou des concepts).
Il ne faut pas non plus mélanger des registres différents et le scientifique ne peut s'autoriser à extraire des informations d'un corpus destiné à un certain registre en les appliquant à un autre. Un corpus construit à partir de textes scientifiques ne peut être utilisé pour extraire des informations sur les textes vulgarisés, et un corpus mélangeant des textes scientifiques et vulgarisés ne permettra de tirer aucune conclusion sur ces deux registres.

en relation

  • question corpus
    436 mots | 2 pages
  • question corpus
    930 mots | 4 pages
  • Synthese fr
    1615 mots | 7 pages
  • methodo_quest_corpus 2
    2186 mots | 9 pages
  • Question typre bac identification registre
    394 mots | 2 pages
  • L'utopie dans le corpus
    254 mots | 2 pages
  • question de corpus
    765 mots | 4 pages
  • Methodologie dossier
    349 mots | 2 pages
  • hbio u^pçopù
    317 mots | 2 pages
  • complement_4f294e4f94cc8
    6392 mots | 26 pages
  • Synthese
    1126 mots | 5 pages
  • Maison du monde
    539 mots | 3 pages
  • lapin
    464 mots | 2 pages
  • ta mere
    436 mots | 2 pages
  • Corpus
    578 mots | 3 pages