Analyse des données
0
Il existe des informations réservées.
80-615-91 -Classification automatique : modèles, algorithmes et applications
MAINTENANCE:
Hiver 2011 : J01 Hansen,Pierre
ZoneCours sera Présentation non disponible les samedis de 1h à 6h du matin. Objectifs Merci de votre collaboration. L'exploitation des
données (data mining) a pour but d'extraire de l'information précise, pertinente et profitable de grandes bases de données, disponibles dans des entreprises et centres de recherche de plus en plus nombreux. Cette discipline prolonge l'analyse de données en l'appliquant à des instances beaucoup plus grandes qu'auparavant. La classification automatique est au centre de cette démarche. Elle comprend deux classes principales de problèmes : La classification non supervisée : étant donné un ensemble d'entités, on se propose de déterminer des classes (clusters) d'objets de cet ensemble qui sont homogènes (c'est-à-dire dont les objets se ressemblent) et/ou bien séparées (c'est-à-dire telles que des objets de classes différentes sont dissemblables). La classification supervisée (ou discrimination); étant donné un ensemble d'entités appartenant à 2 classes bien spécifiées (ou plus) déterminer une fonction séparant le mieux possible les objets d'une classe de ceux de (s) autre (s). Cette fonction servira ensuite à affecter de nouveaux objets à l'une ou l'autre classe. Ces problèmes peuvent être généralisés (i) en considérant les classes obtenues et pour chacune d'entre elles une fonction de prévision (ii), en recherchant des relations entre les entités plutôt que des classes (iii), en recherchant des relations entre variables décrivant les entités. La Recherche Opérationnelle et l'Informatique se sont dotés d'outils puissants pour la conception et l'analyse des algorithmes heuristiques et exacts, notamment les théories de