Article sur le big data
Key words: DataWarehouse, DataMart, Datamining, Plate-forme BigData, Cloud Computing, SQL, NoSQL, NewSQL
Résumé : L'informatique décisionnelle propose une vision d'ensemble des outils d'aide à la décision allant de la base de données relationnelle, en passant par le DW (Data Warehouse), au DM (Data Mining). Il nous permet d'observer leur positionnement dans la chaîne de production d'information et de connaissances. Cet article nous éclaire sur les choix d'outils à faire en fonction de leur robustesse, du niveau de fiabilité des résultats obtenus et de leur domaine d'application.
Chapitre I: Data Warehouse / Datamart / Datamining /Plateforme BigData
1. Data Warehouse
C’est le lieu de stockage des données provenant des bases de données externes servant à l’aide à la décision .C’est dans cette base que les utilisateurs puissent les données par le biais d’outil de restitution. Le DW se structure en quatre classes de données, organisées selon un axe historique est un axe synthétique. Les données détaillées : Elles reflètent des évènements les plus récents. Les données provenant des systèmes de production sont intégrées à ce niveau. Les données agrégées : Elles correspondent à des éléments d'analyse représentatifs des besoins des utilisateurs. Ce sont donc des données déjà traitées par le système et représentant un premier résultat d'analyse et de
synthèse des données contenues dans les systèmes de production. Elles doivent être facilement accessibles et compréhensibles. Les données historisées : Chaque nouvelle insertion dans le datawarehouse ne détruit pas les anciennes valeurs mais créée une nouvelle insertion. Les méta-données : Il s'agit « de données sur les données ». Elles décrivent les règles ou processus attachés aux données du système. Les méta-données permettront notamment de connaître :
quelles sont les données entreposées, leur format, leur signification, leur degrés d'exactitude. les