Recherche documentaire et initiation informatique fac 1ère année

Disponible uniquement sur Etudier
  • Pages : 14 (3354 mots )
  • Téléchargement(s) : 0
  • Publié le : 8 juin 2010
Lire le document complet
Aperçu du document
Recherche documentaire et initiation à l’informatique
La recherche d’information

I) Quelques préalables

1) L’histoire de la recherche d’informations
Dans les années 60, le recherche d’information se faisait en mode différé : d’abord l’utilisateur puis va voir un documentaliste qui allait voir un informaticien qui faisait la recherche.
Dans les années 70 l’utilisateur va voirle documentaliste qui pouvait interroger directement les serveurs.
En 1980 le minitel est un outil permettant de consulter des informations sur tous les serveurs.
Année 90 apparition d’internet, la bibliothèque universel.
En 2000 l’utilisateur est laissé seul face à l’information.

2) Constats
80% des utilisateurs qui utilisent les moteurs de recherche se vont taper un, deux, ou trois motsclés. A priori ce n’est pas la meilleure solution. En moyenne les utilisateurs passent 80% de temps à chercher l’information et 20% à la traiter.
35% des internautes saisissent un seul mot clés, 35% en saisissent deux, en minuscule et sans accent. 25% d’internautes vont sur la deuxième page, 7% sur la troisième, et 3 % au delà.

3) Trois catégorie de recherche
1. les outils humains
On lesappelle « annuaire », « répertoires », « guide »…
- Ces outils humains peuvent avoir une couverture géographique, donc quand on les utilise on ne trouve que des sites hébergés sur le territoire français ou en langue française.
- La seconde grille de couverture est la couverture thématique.
- La troisième type de couverture est spécialisée dans un type de donnée. (images, sites ftp)
Quelquesoutils : lycos.fr, voilà.fr, aol.fr (français). Demon, yahoo (outil qui au départ était un annuaire et qui est devenu un moteur de recherche)

•Un annuaire Cherche à être qualitatif et non quantitatif. Un annuaire va référencer des sites et non pas des pages webs, donc chaque page web ne va pas être référencée, mais juste le titre du site global.
La taille d’un annuaire correspond à 2/3millions de sites, il reprend le système de l’arborescence par catégories, sous catégories et à la fin une fiche descriptive.
Dans les annuaires il y a des netsurfer qui surfent tout le temps sur internet et remplisse des fiches descriptives. Ces netsurfer utilisent les moteurs de recherche et quand ils trouvent un site ils le rajoutent à l’annuaire, ou bien ceux qui créent les sites web demandent àêtre référencés.
Dans la fiche descriptive il y a un titre, des mots clés, un résumé, une adresse (UnifiedRessourceLocator), et une note sur la qualité du site (aspect visuel, ergonomie, contenu). Donc si ce que l’on tape dans l’annuaire se retrouve dans la fiche descriptive, on est redirigé vers le site.

•Les moteurs de recherche
Les moteurs cherchent à être quantitatifs. Sur ces moteurs derecherche ce sont les pages webs, individuellement, qui sont référencées (pas d’organisation hiérarchique sous forme d’arborescence). Les moteurs de recherche référencie environ 8 milliards de pages. Contrairement aux annuaires il n’y a pas de netsurfer, mais un programme appelé le « spider », ou « robot ». Dans l’annuaire des moteurs de recherche il y a 40% des pages qui sont montrées, et 60%qui sont des pages webs invisibles (protégées par un mot de passe) et les pages webs crées dynamiquement (sur mesure). Mais chaque moteur de recherche dispose d’une partie des 40% d’information disponible. (5% de pages en français).

•Le robot
Il trouve de nouvelles pages webs grâce au référencement et via les liens des sites qu’il référencie déjà. Il recense les mots utilisés le plus souventdans la page et la met comme mot clé.Il regarde aussi les mots qui apparaissent dans le titre du document, sachant que ces mots là ont plus de valeur que les mots contenus dans la page web. Il regarde aussi les mots qui ont subi une mise en forme et si les mots apparaissent au début ou à la fin d’un document. Mais le spider a évolué car il n’était pas assez performant. En effet il ne pouvait pas...
tracking img