Caracteristique d un pays a economie dominee , cas du benin
5. HTML et le protocole HTTP
DESS TEXTE
Outils informatiques 5. HTML et le protocole HTTP – p.1
Introduction
But du cours : récupérer automatiquement des données accessibles sur le web pour en extraire les informations pertinentes.
Prérequis à cela : maîtriser les notions que consituent HTML et
HTTP
Ce chapitre va donc présenter brièvement les réseaux informatiques, et le fonctionnement du W3 dans ce contexte.
Outils informatiques 5. HTML et le protocole HTTP – p.2
Plan du chapitre
1. HTML et HTTP
2. Cheminement d’une requête :
a. Analyse d’une requête
b. Analyse d’une réponse
3. Traitement du corps de la réponse :
a. Traitement d’une image
b. Traitement d’un lien hypertexte
4. Les différentes couches réseau :
a. PC et serveur sur le même sous-réseau
b. PC et serveur sur deux sous-réseaux différents
Outils informatiques 5. HTML et le protocole HTTP – p.3
1. HTML et HTTP
HTML : langage utilisant des balises pour représenter la mise en forme de documents. Ce langage est interprété par une application appelée navigateur Web ou arpenteur.
HTTP : protocole de communication pour le transfert de documents. La communication se fait entre un client (machine envoyant des requêtes) et un serveur (machine répondant à ces requêtes). Ce protocole est utilisé par les serveurs Web hébergeant des sites internet, dans le but de permettre de télécharger des documents ainsi que la consultation de pages sur l’écran du client.
Remarque : il faut connaître HTTP pour communiquer avec un serveur Web sans passer par un navigateur (i.e. pour automatiser des requêtes internet).
Outils informatiques 5. HTML et le protocole HTTP – p.4
2.a Analyse d’une requête
Soit la requête suivante : http ://hypothetical.ora.com/
Ce qui provoque l’envoie du message suivant par le navigateur :
GET / HTTP/1.0
Connection : Keep Alive
User-Agent : Mozilla/3.0Gold (WinNT;I)
Host : hypothetical.ora.com
Aspect :