deep web

326 mots 2 pages

Le web profond ou web invisible ou encore web caché (en anglais deep web) est la partie du web accessible en ligne, mais non indexée par des moteurs de recherche classiques généralistes ; certains moteurs, tels que BASE, prennent cependant en compte cette partie du réseau. La terminologie web profond est opposée à web surfacique.
Une partie très importante du web est théoriquement indexable, mais non indexée de fait par les moteurs. Certains auteurs3 parlent dans ce cas, pour le web non profond et non indexé, de web opaque (opaque web) ou de web presque visible (nearly visible web).
Le web profond et le web opaque sont accessibles en ligne aux internautes, les deux ne sont pas indexées par les moteurs : le web opaque pourrait être indexé.
Les algorithmes des moteurs étant semblables (par exemple, page rank), les zones indexées se recoupent en partie d'un moteur de recherche à l'autre. Les ressources matérielles des robots d'indexation ne sont pas, malgré des moyens matériels importants, à même de suivre tous les liens théoriquement visibles par eux, que le web (gigantesque) contient.
Une équipe de chercheurs allemands a étudié le comportement des robots d'indexation face à des sites contenant énormément de pages. Ils ont créé un site web composé de 2 147 483 647 pages (231 - 1). Ce site web étant un arbre binaire, il est très profond (il faut au minimum 31 clics pour arriver à certaines pages). Ils ont laissé ce site en ligne, sans le modifier, pendant une année. Les résultats montrent que le nombre de pages indexées pour ce site, dans le meilleur des cas, ne dépasse pas 0,0049 %.
Afin de résoudre ce problème de volumétrie de pages à indexer pour un site donné, le moteur Google a introduit en 2005, le protocole sitemap. Il permet, grâce à la mise à disposition du robot d'un fichier sitemap, de gagner en efficacité pour l'indexation. Ce fichier est mis à la racine du site par l'administrateur du site

en relation

Defi historiens arts temps modernes fiche eleves jardins versailles 1
356 mots | 2 pages

7. Indices permettant d'accorder sa confiance au site visité Le site Internet que vous venez de visiter a….

montre plus
Ce sera samoa
507 mots | 3 pages

Le site est traduit en toutes les langues y compris japonais, chinois, cyrilliques… Les 2 fondateurs , jeunes, beaux et forcément intelligents n’hésitent pas à poser sur la page d’accueil du site devant leur Ferrari respective. Le rêve américain réalisé…toi aussi, demain tu peux devenir riche. Les sites Internet créés n’ont plus aucun intérêt, leur but n’est que de prospecter de nouveaux webmasters qui, à leur tour, feront un site pour trouver d’autres filleuls.….

montre plus
Programmation web
325 mots | 2 pages

Question 1 : Indiquez deux façons de cacher des informations dans une page web. Réponse : Contrôle : champ caché (hidden) pour envoyer de l'information au serveur que l'utilisateur n'a pas besoin de voir ou de connaître. Avec la méthode post, les paramètres de l'URL ne seront pas visible pour l'utilisateur. ???….

montre plus
Njjkl
1286 mots | 6 pages

Plus son PageRank est élevé, plus il aura de chance d'être affiché dans les premiers résultats d'une recherche. Ce système donne une indication de la « popularité » du document parmi les autres documents du web. Ce principe a immédiatement été un succès, car il a permis des résultats plus pertinents que les autres moteurs de recherche qui se contentaient de comptabiliser les mots-clés insérés dans les pages des sites. Il a également permis ce que l'on appelle le bombardement Google.….

montre plus
Devenir cadre chez google.
661 mots | 3 pages

La société Google est née le 7 septembre 1998 fondée par les inventeurs du moteur de recherche «google» Sergey Brin et Larry Page, deux ingénieurs issues de la prestigieuse université de Stanford. Rejoins en 2001 par le PDG Eric Shmidth, les trois chefs d’entreprise forme un trium virat peu commun qui bouscule les règles classiques du management. Spécialisé dans l’indexation de pages internet, google comptait en 2005 25 milliards de pages indexées. Aujourd’hui, google est le moteur de recherche le plus utilisé au monde et développe de nombreux autre produits en parallèles qui tendent à concurrencer frontalement microsoft. Dans la première partie nous verrons pourquoi google a besoin des meilleurs et où il va les chercher.….

montre plus
Etude de cas Alix & digitalisation
989 mots | 4 pages

-L’indexation du site internet : il est obligatoire qu’un site soit indexé pour qu’il apparaisse dans la liste de requête de Google. -Donner un titre a toutes les pages : même si cela peut paraître évident, toutes les pages de votre site internet doivent avoir un titre de page unique -Structure claire : il est important d’avoir une architecture claire et une navigation simple pour les internautes. -Choix des mots ou expressions-clés3.2. Les 3 mots clés intéressant à utiliser pour une stratégie de longue traîne vont être : -coffre shop valence -matcha latte Valence -expresso bar valence 3.3. Anti-âge, anti-stress, brûle-graisse et… photogénique, le matcha, poudre de feuilles de thé vert japonais, et ses prétendues vertus avaient déjà séduit les chefs.….

montre plus
Base de données_Bts ci
941 mots | 4 pages

Un site Internet comprend une adresse qui l’identifie et un certain nombre de pages Web qui présentent les informations. Ces pages sont organisées et reliées entre elles. Construire un site ne s’improvise pas. Il faut de la méthode ». Site internet 2. «….

montre plus
Ergonomie pour les seniors
3536 mots | 15 pages

Définie par des normes techniques établies par le Web Accessibility Initiative (WAI) du World Wide Web Consortium, avec l’objectif de Mettre le web et ses services à la disposition de tous les individus, quel que….

montre plus
Polution de laire
838 mots | 4 pages

WEBMARINE La Marine Nationale Les années passent et la toile évolue. Nous trouvons de plus en plus de pages officielles ou officieuses consacrées à la Marine Nationale. Ce sont souvent de simples outils de communication, parfois des sites passionnants . Nous avons pensé utile de vous les présenter car vous ne les connaissez certainement pas toutes.….

montre plus
Sandage et bandage
2862 mots | 12 pages

Chaque page identifiée est alors indexée dans une base de données, accessible ensuite par les internautes à partir de mots-clés. C'est par abus de langage qu'on appelle également moteurs de recherche des sites web proposant des annuaires de sites web : dans ce cas, ce sont des instruments de recherche élaborés par des personnes qui répertorient et classifient des sites web jugés dignes d'intérêt, et non des robots d'indexation — on peut citer par exemple Voilà et Yahoo!, etc. Les moteurs de recherche ne s'appliquent pas qu'à Internet : certains moteurs sont des logiciels installés sur un ordinateur personnel. Ce sont des moteurs dits desktop qui combinent la recherche parmi les fichiers stockés sur le PC et la recherche parmi les sites Web — on peut citer par exemple Exalead Desktop, Google Desktop et Copernic Desktop Search, Windex Server, etc On trouve également des métamoteurs, c'est-à-dire des sites web où une même recherche est lancée simultanément sur plusieurs moteurs de recherche (les résultats étant ensuite fusionnés pour être présentés à l'internaute) — on peut citer Ixquick, Mamma, Kartoo, Seek.fr, Kelseek.fr, etc.….

montre plus
Theorie du droit
2158 mots | 9 pages

Respecter la sémantique, c'est améliorer l'accessibilité... et aussi le référencement. Cela dit, on ne perdra jamais de vue que l'humain passe avant les robots ! On fait un site pour des utilisateurs, pas pour le plaisir de se retrouver en tête de requêtes sur google. Voici donc les quelques balises (x)html fondamentales à connaître pour comprendre la structure d'une feuille de style. Feuille de style de base Une feuille de style CSS externe peut se faire avec le simple bloc-note, et il est d'usage de lui faire porter l'extension .css.….

montre plus
Ccf e42
924 mots | 4 pages

J’ai tapé sur la barre de recherche Google « meilleurs moteurs de recherche » et j’ai obtenu ce site : http://www.1001services.com/moteurs.htm . Il m’a permis d’obtenir plusieurs résultats en même temps sur plusieurs moteurs de recherche (Google, Lycos, Web Crawler). Ainsi j’ai pu sélectionner les informations les plus pertinentes. C’est donc une sorte de métamoteur.….

montre plus
Rapport de stage ta
8595 mots | 35 pages

En effet, la home page d’un site est le premier facteur clé de succès puisque c’est principalement selon elle que l’internaute va rester ou non sur le site. D’autres éléments sont obligatoirement à prendre en compte tels que les facilités de paiement, la confiance, la disponibilité des prix, la rapidité des livraisons. Une autre alternative vient compléter la liste précédemment énumérée, ce sont les réseaux sociaux. Ils sont devenus le support incontournable de promotion des sites e-commerce et sont désormais présents sur tous les fronts tels que Twitter, Facebook…….

montre plus
Management
829 mots | 4 pages

Exemple : Seek, Copernic Agent Basic. II – Les sources d'informations Les web invisible : Le Web invisible ou Web caché est la partie du Web correspondant à l'ensemble des documents qui ne sont pas indexés par les outils de recherche traditionnels. Les ressources du web invisible comprennent en autre les sites web construit autour de base de donnée. Exemple de web invisible :….

montre plus
Annabelle
937 mots | 4 pages

GOOGLE L’avènement d’une société monde Bories Charles Exposé : Internet permet l’existence d’un réseau informatique à l’échelle mondiale. Il existe un élément majeur dans ce réseau qui déculpe ses possibilités : Google. C’est le moteur de recherche le plus important, et il permet de mettre en coprésence des millions de personne du monde entier. Nos exposants se sont alors demandés dans….

montre plus