Assainissement bd
QUALITÉ DES DONNÉES Table des matières
1
1.1
Enjeux et fondements _______________________________________________________ 3
Les enjeux______________________________________________________________________ 3 Les fondements _______________________________________________________________ 4 1.2
2
Le processus « qualité des données » ___________________________________________ 5
2.1 2.2
2.2.1 2.2.2 2.2.3 2.2.4 2.2.5 2.2.6 2.2.7
Mesurer______________________________________________________________________ 5 Améliorer ____________________________________________________________________ 6
La correction _______________________________________________________________________ 7 La normalisation ____________________________________________________________________ 7 L'assainissement_____________________________________________________________________ 7 Le dédoublage ______________________________________________________________________ 8 L'épuration_________________________________________________________________________ 9 La prévention______________________________________________________________________ 10 L'enrichissement ___________________________________________________________________ 10
2/12
QUALITÉ DES DONNÉES
A moins d'être un spécialiste, la personne qui s'intéresse à la « qualité des données » des systèmes informatisés ne peut qu'être surprise par la diversité des sujets traités dans les articles, études ou commentaires relatifs à ce domaine. Pour s'en convaincre, il suffit d'interroger le web ou de considérer le contenu de sites internet tel que http://www.dataqualitypro.com/ . Ce dernier aborde de très nombreuses thématiques allant de la définition des « règles données » au « modèle conceptuel » en passant par les discussions autour du « data profiling »: mythe, réalité, ou nécessité de « professionnels de la qualité des données » ? Ce foisonnement donne l'image d'un domaine « bouillonnant » d'idées mais dont les