Analyse des donnees
Introduction Les éléments d'une classification Notion d'inertie Formalisation de la notion d'espace de classification I Les éléments d'une classification Les problèmes de classification automatique diffèrent selon le type d'information recherché: une hiérarchie, une partition, ... 1.1 Les partitions Une partition de l'ensemble des observations Ω est un ensemble de parties non vides P =(P1,…,Pk) d'intersection vides deux à deux et dont la réunion forme Ω avec :
Ainsi avec les sept points suivants:
on peut, par exemple, construire une partition en trois classes: P=(P1, P2, P3) représentée par P1 ={ w7}, P2 = { w5 , w4, w6} et P3 = { w1 , w2, w3}.
1.2 Les recouvrements Un recouvrement de Ω est un ensemble de parties non vides P =(P1, ... ,Pk)dont la réunion
forme Ω. Avec les sept points précédents, on peut aussi construire un recouvrement à trois classes
P=(P1, P2,P3): P1 ={ w7 , w5,w4}; P2 ={ w5 , w4,w6}; et P3 ={ w1 , w2,w3} représenté par:
Une partition est donc un cas particulier de recouvrement: 1.3 Les Hiérarchies On cherche à représenter Ω par un ensemble de partitions emboîtées. Soit Ω un ensemble fini, H un ensemble de parties (appelées paliers) non vides de Ω. H est une hiérarchie sur Ω si :
Nous utilisons encore l'ensemble Ω formé des sept points précédents; une hiérarchie associée H associée peut être:
On a bien H= avec hi={wi} pour i=1,7