Mémoire google

7478 mots 30 pages
MEMOIRE CNAM/ETN 204/2010/CARPENTIER PATRICK

LE MOTEUR DE RECHERCHE ET SON BUSINESS MODEL CHEZ GOOGLE
Pour certains points, j'étendrai l'analyse aux pratiques de la société Google dans son ensemble

Note préliminaire très simplifiée : qu'est-ce qu'un moteur de recherche ?

C'est un système logiciel qui permet d'explorer tout l'Internet ouvert - sites web, blogs, forums, images, vidéos, réseaux sociaux, bases de données...-, pour y trouver des blocs d'informations qu'on peut légitimement et sémantiquement associer à des mots ou des groupes de mots (les requêtes).

Un moteur de recherche remplit 3 fonctions.

- L'exploration (crawling) consiste à envoyer un robot logiciel explorer l'Internet systématiquement et cycliquement, pour y repérer toute nouvelle source de données. Dans le cas des sites web, chaque fois que le robot rencontre un lien pointant vers une page d'un autre site, il s'y rend de manière automatique.

- L'indexation des sources de données atteintes consiste, pour les ressources texte, à extraire tous les mots significatifs de chaque ressource et à les enregistrer dans une base de données qui permet, pour toute requête sur un mot, de retrouver le document Internet dont il provient. L'indexation peut se faire à la volée, lors du passage du robot sur le site exploré, ou après rapatriement du contenu des pages sur un serveur.

- La recherche proprement dite, et la fonction de présentation de la réponse aux requêtes. Un algorithme est appliqué à la base de données pour identifier les ressources (le plus souvent des pages de sites web) correspondant le mieux aux mots de la requête, et les présenter par ordre de meilleure pertinence. C'est à ce niveau que la difficulté existe. Les moteurs de recherche simples utilisent des requêtes booléennes, mais cette approche atteint vite sa limite sur des corpus volumineux. Les moteurs plus évolués utilisent une approche dite TF-IDF (notion de fréquence de termes dans le corpus, utilisation d'approche

en relation

  • Travail d'actualité taxe google
    658 mots | 3 pages
  • La communication chez google
    2361 mots | 10 pages
  • Njjkl
    1286 mots | 6 pages
  • Dossier D Finitif
    4069 mots | 17 pages
  • Devenir cadre chez google.
    661 mots | 3 pages
  • DIAGNOSTIC STRATEGIQUE THALES
    5770 mots | 24 pages
  • C'est l'histoire d'un mec
    2020 mots | 9 pages
  • Etude de gestion : Google
    552 mots | 3 pages
  • management
    1280 mots | 6 pages
  • Ccf e42
    924 mots | 4 pages
  • Codes de luxe
    981 mots | 4 pages
  • Chantal
    721 mots | 3 pages
  • Synth Se
    692 mots | 3 pages
  • philo
    447 mots | 2 pages
  • Mercatique
    1162 mots | 5 pages