Dataware housing

Disponible uniquement sur Etudier
  • Pages : 14 (3323 mots )
  • Téléchargement(s) : 0
  • Publié le : 12 décembre 2011
Lire le document complet
Aperçu du document
Datawarehouse

C. Vangenot

Plan
Partie 1 : Introduction
1. Objectifs 2. Qu'est ce qu'un datawarehouse? 3. Pourquoi ne pas réutiliser les BD? ROLAP MOLAP HOLAP

Partie 2 : Implémentation d'un datawarehouse

Partie 3 : Cube

Hypercube: Mesures et Dimension Opérateurs de manipulation

Partie 4 : Modélisation en étoile et en flocon Partie 5 : Conception d'un datawarehouse

Partie1: Introduction

1- Objectifs
Transformer un système d’information qui avait une vocation de production en un SI décisionnel
= Transformation des données de production en informations stratégiques

Exemple de requêtes décisionnelles :
Catégorie socioprofessionnelle des meilleurs clients de chaque région Evolution de la part de marché d’un produit particulier Nombre d'employé de l'entreprisepar classe d'âge, par sexe, par grade Quel est le profil des employés les plus performants?

Objectifs (2)
Gestion et visualisation des données doit être rapide et intuitive -> visualisation multi-dimensionnelle des données:
Date

Ecrou Vis

Boulon Joint

Janvier Février Mars

Région

Est

Centre Ouest

Type de Produit

Objectifs (3)
Pour cela, nécessaire de retrouver etd’analyser rapidement les données provenant de diverses sources DW offre une vision transversale des données de l'entreprise
intégration de différentes BDs

Les données doivent être :
Extraites Groupées ensembles et organisées Corrélées Transformées (résumé, agrégation)

2- Qu'est ce qu'un data Warehouse?
Ensemble de données
destinées aux "décideurs" souvent une copie des données deproduction avec une valeur ajoutée (agrégation, historique) intégrées historisées de regrouper les données de nettoyer, d'intégrer les données, ... de faire des requêtes, rapports, analyses de faire du data mining faire l'administration du warehouse

Ensemble d'outils permettant

Fonctions d'un Data Warehouse
Récupérer des données existants dans différentes BD sources Stocker les données(historisées) Mettre à disposition les données pour :
Interrogation Visualisation Analyse

Architecture
Data Warehouse OLAP Servers Clients

Data Mining

Bases de production Data Marts Requêtes Rapports OLAP

*MOLAP, ROLAP, HOLAP

INTEGRATION

Data warehouse

Cubes* Analyses statistiques Tableurs

3- Pourquoi ne pas utiliser un SGBD?
SGBD et DW :
ont des objectifs différents et font destraitements différents stockent des données différentes font l'objet de requêtes différentes -> SGBD et DW ont besoin d'une organisation différente des données -> SGBD et DW doivent être physiquement séparés.

SGBD: Objectifs et traitements
Les SGBD sont des systèmes dont le mode de travail est transactionnel (OLTP On-Line Transaction Processing). Permet d'insérer, modifier, interroger desinformations rapidement, efficacement, en sécurité. Deux objectifs principaux :
Sélectionner, ajouter, mettre à jour et supprimer des tuples Ces opérations doivent pouvoir être effectuées très rapidement, et par de nombreux utilisateurs simultanément.

DW: Objectifs et traitements
Les datawarehouse sont des systèmes conçus pour l’aide à la prise de décision. (Mode de travail: OLAP On-LineAnalytical Processing) La plupart du temps sont utilisés en lecture (utilisateurs) Les objectifs principaux sont
regrouper, organiser des informations provenant de sources diverses, les intégrer et les stocker pour donner à l’utilisateur une vue orientée métier, retrouver et analyser l’information facilement et rapidement.

Données différentes
D’après BILL Inmon : “Un DW est une collection dedonnées orientées sujet, intégrées, non volatiles, historisées, organisées pour la prise de décision.”
Orientées sujet: thèmes par activités majeures ; Intégrées: divers sources de données ; Non volatiles: ne pas supprimer les données du DW ; Historisées: trace des données, suivre l’évolution des indicateurs.

Orientées sujet

Production

Données produit

Employés

Données client...
tracking img