segmentation de discours à l'oral sur la qualité d'expression
Martial Pastor Master Science du Langage: Langue et Informatique, Sorbonne Université Faculté de
Lettres, 11 rue Victor Cousin, Paris, France martial.pastor@etu.sorbonne-universite.fr
R ÉSUMÉ
Sont ici présentés les résultats d’une recherche sur un corpus de français parlé portant sur le positionnement syntaxique du marqueur orale euh. Notre hypothèse est que son occurrence en début …afficher plus de contenu…
Cela pouvant aboutir à des résultats plus ou moins saillants selon notre hypothèse. Néanmoins, afin de remédier (plus ou moins naïvement) à cette considération, nous avons sélectionné deux enregistrements de nature différentes.
Le premier enregistrement ( ENT_002 ) est tiré d’un entretien entre deux locuteurs datant de 1969. La personne interrogée est un expert en matière de vitraux et d’art, son âge se situe entre 35 et 45 ans.
Le questionnaire étant «ouvert», ce dernier est donc en mesure de librement discourir sur …afficher plus de contenu…
Ces dernières sont susceptibles de passer pour des stratégies de questionnement et sont par conséquent potentiellement maîtrisées par les locuteurs. Ce sont vraisemblablement des énoncés collaboratifs.
Une fois ces occurrences mises à l’écart et les autres annotées, nous pouvons dresser le tableau suivant :
T ABLE 2 : Nombre de données récoltées sur base de deux enregistrement.
1 Le jeu de données et le code source de l’outil sont téléchargeable à l’adrresse suivante : https://github.com/metabolean5/corpus_linguistics Enregistrement euh en début de segment, sans disfluence dans la suite du