Tijari wafa

Disponible uniquement sur Etudier
  • Pages : 13 (3158 mots )
  • Téléchargement(s) : 0
  • Publié le : 2 mai 2011
Lire le document complet
Aperçu du document
Recherche d’information : contours et bonnes pratiques
Pr. Mohand Boughanem bougha@irit.fr http://www.irit.fr/~Mohand.Boughanem Université Paul Sabatier de Toulouse Laboratoire IRIT, UMR5055 118 Route de Narbonne F-31062 Toulouse

ENSIAS 2010

1

Plan
• Comprendre ce qu‟est la Recherche d‟information (RI)
– Intérêt et contours – Fonctionnement «interne» d‟un système de RI

• Caspratique : Recherche d‟information sur le Web
– Bonnes pratiques en tant que producteur d‟information
•  Valoriser son site

– Bonnes pratiques en tant que consommateur de l‟information
•  Utiliser le bon outil

• Conclusion : nos activités de recherche en RI
ENSIAS 2010 2

1

Qu’est ce que la RI ?
• Recherche d‟information (RI) Ensemble des méthodes, procédures et techniques pourl‟acquisition, l‟organisation, le stockage, la recherche et la sélection d‟information (données, texte, son, images, vidéo).

ENSIAS 2010

3

Exemples de Systèmes de RI

ENSIAS 2010

4

2

Volume sans cesse croissant • Gros volumes d‟informations (numériques) créées toutes les minutes • 1% sur l‟Internet (localisé par les moteurs) • 99% dans des Intranet (entreprises, laboratoires, …)ENSIAS 2010

5

.. en perpétuelle croissance
KiloOctets
Exaoctets
1 800 1 600 1 400 1 200 1 000 800 600 400 200 0
2006
ENSIAS 2010

103 106 109 1012 1015

MegaOctets GigaOctets TeraOctets PetaOctets

Facteur de 10 en 5 ans!

DVD RFID ExaOctets 1018 Digital TV MP3 players ZettaOctets 1021 Digital cameras Camera phones, VoIP Medical imaging, Laptops, Data center applications, GamesSatellite images, GPS, ATMs, Scanners Sensors, Digital radio, DLP theaters, Telematics Peer-to-peer, Email, Instant messaging, Videoconferencing, CAD/CAM, Toys, Industrial machines, Security systems, Appliances
2007 2008 2009 2010 2011
6

Source: IDC, 2008

3

.. produite par tout le monde

.. L’information (numérique) est disponible partout
ENSIAS 2010 7

… dans tous les domainesd’activités • Domaines d‟application – Internet (Web, Forum/Blog search, News) – Entreprises – Bibliothèques numériques «digital library» – Domaine spécialisé (médecine, droit, littérature, …) – Nos propres PC (Yahoo! Desktop search)

ENSIAS 2010

8

4

… la RI a un coût
• Rechercher une information a un coût
– « On» passe (en moyenne) 35% de son temps à rechercher des informations – Lesmanagers y consacrent 17% de leur temps – Les 1000 grandes entreprises (US) perdent jusqu‟à $2.5 milliards par an en raison de leur incapacité à récupérer les bonnes informations

• Nécessité de développer des systèmes automatisés efficaces permettant :
– Collecter, Organiser, Rechercher, Sélectionner

E 9 NSIAS 2010

Contours de la RI
• Données, information et connaissance • Tâches derecherche d‟information

ENSIAS 2010

10

5

Contours: Données-Information-Connaissance
Système de gestion de Base de données Système de Recherche d’information

Données : Chaîne de caractères/valeurs associées à des objets, des personnes et des événements :
(15)

Information :
Signification (explication/description) des données, données intelligible (15° C - relevé

Connaissance :Information apprise, découverte, comprise et partagée par une communauté (étant donné qu’on est à Rabat 15°C en mars c’est plutôt froid)
ENSIAS 2010

à 18 h, sous abri, à Rabat)

(information/data mining)
11

Veille a besoin des trois domaines
Système de gestion de Base de données Système de Recherche d’information

information/data mining
12

ENSIAS 2010

6

Contours : Tâches derecherche d’information (1/2)
• Recherche adhoc (classique) – Je cherche des infos (pages web) sur «veille économique » – Requête «veille économique» SRI  renvoie une liste de documents • Classification /catégorisation (clustering) – Regrouper les informations (documents) selon un ou plusieurs • Question-réponses (Query answering) – Chercher des réponses à des questions – par exemple «qui...
tracking img