Language naturel
Béatrice Daille Université de Nantes
1
2001, L’Odyssée de l’espace
L’ordinateur HAL comprend l ’homme, dialogue avec lui dans sa langue, exécute ses commandes, et ressent des émotions.
Langage naturel
2
2001, L’Odyssée de l’espace
L’ordinateur HAL comprend l’homme, dialogue avec lui dans sa langue, exécute ses commandes et ressent des émotions.
A 8 ans de cette échéance en est-on là?
Langage naturel 3
Applications du TALN s s s
s s
Certaines voitures parlent Dictée automatique Correcteurs orthographiques et grammaticaux dans les traitements de textes Systèmes de traduction automatique Photocopieurs ou téléphones qui traduisent
Langage naturel 4
Applications du TALN s s s s s s
Moteurs de recherche du Web Assistante personnelle virtuelle Scanner (OCR) Saisie de textes sur des claviers de taille réduite Routage de documents Analyse des opinions
Langage naturel 5
Plan de l’exposé s s s
Les bases Application bluffante : ELIZA (1966) Recherche de motifs s Expressions rationnelles s Automates à états finis
Langage naturel
6
Les bases s s s s
Caractères et codes Chaînes de caractères et mots Phrases Textes, tris, loi de Zipf
Langage naturel
7
Caractère (au sens informatique)
Pour l’ordinateur, chaque caractère correspond à un code, généralement un nombre entier, même les caractères invisibles. Un code : une table de correspondance qui associe à une donnée numérique un symbole graphique (glyphes) 1 A 2 B 3 C 4 D 5 E … 23 24 25 26 … W X Y Z
8
Langage naturel
Critères des codes
Nom : un code est toujours nommé Taille : Indication du nombre de bits nécessaires pour coder les symboles Symboles (alphabet latin) :
– – – – les 10 chiffres, les 26 lettres de l’alphabet les signes de ponctuation ou des opérateurs les caractères de contrôle
Traitement : tri des caractères
Langage naturel 9
Codes normalisés (1)
ASCII – Norme ISO 646 en