La Base Frantexrt
LA BASE FRANTEXT
INITIATION A LA LINGUISTIQUE DE CORPUS JLUB151 (Mlle Virginie Lethier)
LICENCE SCIENCES DU LANGAGE, DE L’INFORMATION ET DE LA COMMUNICATION (SLIC)
2ÈME ANNEE
SALIM Khairul Akmal
N° Étudiant : 21310244
INDEX
La Base Frantext
Analyse lexicometrique du discours politique
1. ETAPE 1 : Prise en main du corpus
2. ETAPE 2 : Analyse de l’index hiérarchique du corpus
3. ETAPE 3 : Analyse du vocabulaire spécifique
4. ETAPE 4 : Synthèse
‘
JLUB151 La base Frantext (08/10/2014)
Exercice 1
b) 66 textes dans le corpus d'Hugo
c) La liste couvre des textes de 1822 à 1891
d) 5, 141,944 mots
e)
En voyant la liste des mots ici, on peut constater que ce sont les mots « outils » et les ponctuations qui sont les plus fréquents dans le corpus. Ces mots « outils » sont constitués des articles et des conjonctions. A partir de cette observation, on peut donc conclure que notre corpus est un corpus de langue française écrite qui est aussi diverse car, la structure du Français oblige une forte emploie de ces mots.
Exercice 2
a) La recherche compte 18, 969 occurrences. Non, cette statistique ne permet pas de savoir si la thématique du temps est forte ou non dans l’œuvre de V. Hugo car il faut que l’on fasse une comparaison entre la somme des mots « du temps » et la totalité des mots dans les œuvres de V. Hugo. Cependant, ce dernier n’est pas aussi suffisant car on doit aussi comparer la fréquence de la thématique du temps avec la fréquence des autres thématiques abordées par V. Hugo pour vraiment décider la fortitude de la thématique du temps.
b) On peut constater ici que l’emploi du mot « âge » par Victor Hugo évolue avec le temps et le pic de la fréquence de ce mot est dans les années 1830 – 1839 avec une fréquence relative de 172. Dans la généralité de l’évolution de l’utilisation de ce mot, on peut observer qu’il est de moins en moins utilisé vers la fin de la vie de l’écrivain.