Collocation

7667 mots 31 pages
Le problème des collocations en TAL
Luka Nerima, Violeta Seretan, Eric Wehrli
Laboratoire d’analyse et de technologie du langage
Département de linguistique, Université de Genève
{Luka.Nerima, Violeta.Seretan, Eric.Wehrli}@lettres.unige.ch
Résumé
Cet article présente le modèle de traitement des expressions à mots multiples tel qu’il est implémenté dans les travaux en TAL du LATL. Il discute le repérage automatique, le stockage dans le lexique, ainsi que la prise en charge de ces expressions dans le parser Fips, le traducteur Its-2 et dans le système d’assistance terminologique TWiC. En se focalisant sur les collocations, les plus flexibles et les plus fréquentes de ces expressions, il met en évidence la nécessité d’effectuer une analyse syntaxique détaillée du texte afin d’assurer le traitement approprié de ces expressions et de garantir une meilleure performance à l’analyse et à la traduction.
Mots-clés : traitement automatique des langues naturelles, extraction de collocations, analyse syntaxique, traduction automatique, traduction de mots en contexte, aide terminologique
1. Introduction
Un des problèmes reconnus en traitement automatique de la langue
(TAL) est celui des expressions à mots multiples, c’est-à-dire des unités lexicales constituées par plusieurs mots orthographiques, non nécessairement contigus. Dans Sag et al. (2002, 2), ces expressions sont définies comme « des interprétations idiosyncrasiques qui dépassent la limite du mot » et on estime que leur proportion dans la langue est
— d’après Jackendoff (1997, 156) — comparable à celle des mots individuels.
Bien que ces expressions constituent une difficulté pour de nombreuses applications en TAL, c’est à coup sûr dans le domaine de la traduction automatique et de l’aide terminologique que l’absence d’un traitement adéquat de ces expressions se fait le plus cruellement sentir. La traduction littérale d’une expression — suite à sa nonidentification par le système — de même que la

en relation

  • Allocation
    553 mots | 3 pages
  • Allocation
    1556 mots | 7 pages
  • Allocation
    7254 mots | 30 pages
  • Coordination
    904 mots | 4 pages
  • Cotation
    2200 mots | 9 pages
  • Ségrégation
    1306 mots | 6 pages
  • Constution
    411 mots | 2 pages
  • Cohabitation
    2176 mots | 9 pages
  • Colonisation
    659 mots | 3 pages
  • Décolonisation
    413 mots | 2 pages
  • Agregation
    794 mots | 4 pages
  • Cohabitation
    296 mots | 2 pages
  • Cohabitation
    618 mots | 3 pages
  • commlunacation
    11928 mots | 48 pages
  • Cohabitation
    944 mots | 4 pages