le corpus

698 mots 3 pages

Il serait maladroit d'un point de vue méthodologique d'appliquer des traitements statistiques sur le corpus qui a permis de faire ressortir un classement ou une modélisation du langage.

Lorsque l'on travaille avec des corpus, il convient donc de séparer un corpus initial en deux sous-corpus:

le corpus d'apprentissage, qui sert à retirer un modèle ou un classement à partir d'un nombre suffisant d'information ; le corpus de test, qui sert à vérifier la qualité de l'apprentissage à partir du corpus d'apprentissage.
Le calibrage des volumes des corpus se discute en fonction du problème, mais il est fréquent d'utiliser les 2/3 du corpus initial pour l'apprentissage et le tiers restant pour effectuer les tests.

Lorsque le volume du corpus initial n'est pas suffisant, il est possible de croiser les corpus de tests et d'apprentissage sur plusieurs expérimentations. Par exemple, si l'on découpe le corpus initial en 10 sous-corpus, numérotés de 1 à 10

Expérience 1 : utilisation des corpus 1 à 8 en apprentissage, et 9 et 10 pour les tests;
Expérience 2 : utilisation des corpus 1 à 6 et 9 et 10 en apprentissage, 7 et 8 pour les tests;
...
La mesure de qualité des résultats (précision ou rappel) est alors plus précise, mais en aucun cas les corpus d'apprentissage et de tests n'ont été mélangés.

Corpus parallèles et corpus comparables[modifier | modifier le code]
Corpus parallèles[modifier | modifier le code]
On appelle corpus parallèle un ensemble de couples de textes tel que, pour un couple, un des textes est la traduction de l'autre. Il est intéressant d'aligner ces corpus, c'est-à-dire de faire correspondre chaque unité du texte en langue source avec chaque unité de texte en langue cible (au niveau des paragraphes, phrases et mots) pour disposer d'un jeu de données bilingues, en particulier dans des domaines spécialisés où le vocabulaire et l'usage des mots et des expressions évoluent rapidement.

À titre d'exemple, au 26 octobre 2006, les versions

en relation

corpus
2826 mots | 12 pages

Le corpus c'est de la Jesse Mc Cartney : Mon nouvel album symbolise un nouveau départ Aucun lien de parenté avec un certain Paul, mais un artiste accompli à seulement 21 ans. Ce délicieux jeune homme a reçu CitéGAY pour parler de son album Departure, entre electro et R'n B ... (Jesse Mc Cartney, Departure, interview) Les entrevues se suivent et ne se ressemblent pas, mais bizarrement le lieu de rencontre, lui est souvent le même en ce moment.….

montre plus
corpus
1916 mots | 8 pages

Son projet de vie, « OPALKA 1965/1 -  », s’est terminé au moment de sa mort en 2011 à Chieti en Italie. 2) Analyse plastique Cette œuvre est un ensemble de toiles appelées « Détails… » (on en comptait environ 230 en 2010)(1), de cartes de voyages (2), d’autoportraits photographiques (3) et d’enregistrements sur bandes magnétiques. Ce projet est une performance, c’est-à-dire un mode d’expression contemporain où l’événement, l’action et son déroulement dans le temps constitue l’œuvre et dont on garde une trace en les filmant ou en les photographiant. Chaque « Détail » est une toile dont le format (196 x 135cm) correspond à la taille du corps de l’artiste et de l’ouverture de ses bras.….

montre plus
corpus
327 mots | 2 pages

«CLAIRE DE LUNE» DEBUSSY Présentation: Cette œuvre est une musique. C'est un mouvement de la suite bergamasque, pièce pour piano, qui comprend quatre mouvements. Le titre est «Claire de Lune» créée en 1890 par Claude Debussy. C'est une musique au caractère calme et mélodieux. Elle dure cinq minutes.….

montre plus
corpus
443 mots | 2 pages

Strange fruit chantée par Billie HOLIDAY Analyse de l'œuvre : L'auteur de cette chanson est Billie HOLIDAY. Elle est née le 7 avril 1915 et morte le 17 juillet 1959. Elle chante Strange Fruit, une musique de jazz, illustré d'une photo pour mieux percevoir l'horreur de la scène. Billie HOLIDAY chante ce texte à partir de 1939 à New York , dans un café. Elle avait le don de pétrifier l'assistance chaque fois qu'elle le chantait et n'a jamais perdu de son impact au fils des années.….

montre plus
corpus
3312 mots | 14 pages

SESSION 2011 BACCALAURÉAT GÉNÉRAL SÉRIE L DANSE ÉLÉMENTS DE CORRECTION ET BARÈME Ces propositions ne constituent pas un modèle mais des pistes de correction SUJET : ANALYSE DE DOCUMENTS Remarque générale Le candidat doit analyser les documents et trouver, à partir des éléments fournis par ces documents, une problématique qui réponde au sujet.….

montre plus
corpus
4192 mots | 17 pages

Capacités attendues • Traduire le lien entre deux quantités par une formule. Pour une fonction définie par une courbe, un tableau de données ou une formule : • identifier la variable et, éventuellement, l’ensemble de définition ; • déterminer l’image d’un nombre ; • rechercher des antécédents d’un nombre. Les fonctions abordées sont généralement des fonctions numériques d’une variable réelle pour lesquelles l’ensemble de définition….

montre plus
corpus
4192 mots | 17 pages

C H A P I T R E Lecture de graphiques 1 1. Le programme Contenus Fonctions Image, antécédent, courbe représentative. Inéquations Résolution graphique […] d’inéquations.….

montre plus
corpus
960 mots | 4 pages

Discours prononcé par un avocat pour défendre Thérèse devant un tribunal « Messieurs les jurés, Madame Thérèse Raquin est-elle vraiment coupable ? - Messieurs les jurés, suite à une enfance aussi difficile que celle de Madame Thérèse Raquin, éduquée sans ses parents biologiques, n’ayant pas eu tout l’amour qu’une petite fille méritait, élevée aux côtés de son cousin, malade, sans aucune intimité, ne pouvant diriger sa propre vie, sans aucune liberté, sans aucun droit de décision et contrainte d’épouser son cousin, Messieurs les jurés, pensez-vous réellement, Madame Thérèse Raquin capable de tuer son propre mari ? - Oui, malheureusement oui, Messieurs les jurés. Ma cliente avait toutes les raisons de commettre un tel acte. Mais hormis cette enfance difficile, n’y aurait-il pas eu une autre raison qui aurait poussée….

montre plus
corpus
303 mots | 2 pages

Ce corpus est composé de deux textes, à savoir, Le roi s'amuse de Victor Hugo, un récit de 1832, et La machine infernale de Jean Cocteau, une pièce de théâtre de 1934. Il conviendra de retrouver quelles émotions ces deux scènes de révlation cherchent-elles à susciter. Force est de constater que ces deux textes metent en avant un sentiment qui est la tristesse. Dans Le roi s'amuse de Victor Hugo, le père découvre le corps de sa fille, ce qui lui procure de la tristesse, du désespoir.….

montre plus
corpus
320 mots | 2 pages

Pour sortir de son embarra, il commence par « Tout est perdu » puis passe à une tournurebeaucoup plus agressive « Taisez-vous, petite impertinente » ou encore « Taisez-vous petit esprit ». Quant à Albert Jacquard, lui, soutient que l’astrologie est une imposture, il dénonce au discours indirectles astrologues qu’il appelle « voyant », il dit qu’ils font semblant mais que tout ce qu’ils apprennent sur l’astrologie n’est qu’illusion. Pour lui, tous les astrologues ou autres personnes quicherchent à comprendre l’univers, et même l’infini sont juste craintif de l’avenir. Les trois textes mettent en avant les contradictions de ces fausses sciences, leur inefficacité pratique. D’après A.Jacquard, les astrologues désignés comme voyant ont tout simplement un gout pour la réussite commerciale.….

montre plus
corpus
1840 mots | 8 pages

Ruy Blas est une pièce de théâtre en cinq actes de Victor Hugo créée par la compagnie du théâtre de la Renaissance dans la salle Ventadour, le 7 novembre 1838. Le héros de ce drame romantique, Ruy Blas, déploie son intelligence et son éloquence, tant pour dénoncer et humilier une oligarchie accapareuse des biens de l'État que pour se montrer digne d'aimer la reine d'Espagne. Mais cette voix du peuple, éprise de justice, éclairée par l'amour, est prisonnière d'une livrée de valet et d'un maître attaché à perdre la réputation de la reine en lui donnant « son laquais pour amant ». Sommaire [masquer] 1 Personnages 2 Résumé 2.1 Acte I - Don Salluste 2.2 Acte II - La reine d'Espagne 2.3 Acte III - Ruy Blas 2.4 Acte IV - Don César 2.5 Acte V - Le tigre et le lion 3 Analyse 4 Création et accueil 5 Distribution lors de la création de la pièce 6 Mises en scène notables 7 Postérité 8 Notes et références 9 Lien externe Personnages[modifier | modifier le code] Ruy Blas, valet de Don Salluste Don Salluste de Bazan, marquis de Finlas.….

montre plus
corpus
397 mots | 2 pages

Cependant, madame Argante, mère d’Araminte, souhaite ardemment voir sa fille acquérir un titre de noblesse par un mariage avec le Comte. Dorante, grâce à son oncle, est engagé au poste d’intendant dans la maison d’Araminte. Dubois, devenu entre-temps valet d’Araminte, entreprend d’insuffler à celle-ci de l’amour pour Dorante. Une série de « fausses confidences » finiront par avoir raison du cœur de la belle. Lorsqu’enfin Araminte cède à la passion et fait ses aveux à Dorante, il lui confesse : « De tout ce qui s’est passé chez vous, il n’y a rien de vrai que ma passion, qui est infinie, et que le portrait que j’ai fait » (III, 12)[1].….

montre plus
corpus
823 mots | 4 pages

Le corpus soumit à notre étude comprend trois extraits de pièces de théâtre. Le premier extrait est tiré de Le Cid ( acte III, scène4) écrit par Pierre Corneille en 1637,le second extrait issu de Ruy Blas ( ActeV,scèneIV) de Victor Hugo en 1838. Pour finir, le troisième extrait de la pièce de théâtre Les Justes (Acte III) d’Albert Camus écrit en 1949. Nous allons étudier en quoi ces scènes d’amour sont pathétiques.….

montre plus
corpus
677 mots | 3 pages

Introduction [Amorce et présentation du corpus] La demande en mariage est un moment clé de bien des romans : elle peut l’ouvrir (La Princesse de Clèves) et jouer un rôle décisif dans le destin des protagonistes, marquer une étape importante dans son dénouement (Pierre et Jean), ou n’être qu’un moment ordinaire dans la vie du protagoniste (L’Étranger). Ces trois demandes s’inscrivent dans des milieux et des époques contrastées : la cour d’Henri II à la fin du xvie siècle, la petite bourgeoisie provinciale de la fin du xixe siècle, et de modestes employés dans l’Algérie de la colonisation au xxe siècle. [Thème de la question] Elles n’en révèlent pas moins la façon dont chacun des protagonistes s’engage sentimentalement dans la demande et accepte ou refuse les conventions qui, à toutes les époques, régissent l’acte social qu’est le mariage. Le cœur et le corps M. de Clèves joint à sa haute naissance de grandes « qualités » de cœur, une vraie « sagesse ».….

montre plus
corpus
1085 mots | 5 pages

Année universitaire 2014/2015 Collège universitaire Semestre d’automne Introduction à l’histoire contemporaine Jean-François CHANET Plan du cours d’histoire de Jean-François Chanet pour le semestre d’automne 2014. Plan davantage chronologique, mais axes thématiques fondamentaux (liste ci-dessous non exhaustive, les douze axes ne correspondant pas chacun à un seul cours) : 1) Révolution et héritage révolutionnaire/résistances de l’Ancien Régime 2) L’Empire napoléonien : acquis institutionnels, portée internationale, mémoire et légende 3) Libéralisme et libertés 4) Religion, sécularisation 5) Nations, nationalités, États nationaux 6) Empires multinationaux 7) Ruralités, agrarisme 8) Industrialisation 9) Migrations, urbanisation 10) Socialisme(s), internationalisme 11) Colonisation et impérialisme 12)….

montre plus