Dissert
Recherche d'images par le contenu sur Internet Christophe BOUDRY Les développements récents dans le champ des technologies de recherche d'image « par le contenu » autorisent maintenant leur implémentation à grande échelle, notamment leur utilisation sur certains sites web. L'objet de cet article est de présenter les principes de ces méthodes et les principaux sites web qui les utilisent actuellement. Les techniques classiquement utilisées par les outils de recherche sur Internet pour localiser des images utilisent les données textuelles associées aux images, comme les données de la page web où figure une image. Dans ce cas, les méthodes d'indexation et de recherche s'apparentent tout à fait à celles utilisées pour la recherche de pages web, à la différence que les données indexées sont des informations textuelles se rapportant aux images présentes dans la page web. Comme pour les outils de recherche de pages web, le processus de recherche d'images s'effectue dans ce cas en saisissant un ou plusieurs mots clés. Ces méthodes de recherche ont bien entendu comme principal inconvénient de faire totalement abstraction des données intrinsèques des images recherchées et de dépendre totalement de la pertinence du texte associé, présent sur les pages web où figurent ces documents. La recherche d'images par leur contenu. Utilisées encore il y a peu uniquement à titre expérimental sur Internet, les méthodes de recherche d'images par le contenu ont pour principe d'identifier les images pour leurs données elles-mêmes et non à partir du texte qui leur est associé. Généralement le processus de recherche est divisé en deux phases. Une phase d'indexation