Data wirehouse démarche
La Staging Area est une base de données dans laquelle tous les traitements sur les données sont effectués avant leur transfert vers le datawarehouse qui ne contiendra que les données du modèle dimensionnel
ETL : fonction d’un ETL il s’agit d’extraire, transformer et Charger. L’extraction consiste à extraire les données à partir de sources homogènes, la transformation s’occupe de nettoyer, conformer, standardiser, documenter, corriger, dé dupliquer… les données, et le chargement consiste en l’alimentation de l’entrepôt de données.
Acronyme de Extraction, Transformation, Loading, est un système de chargement de données depuis les différentes sources d'information de l'entreprise (hétérogènes) jusqu'à l'entrepôt de données (modèles multidimensionnels). Ce système ne se contente pas de charger les données, il doit les faire passer par un tas de moulinettes pour les dé-normaliser, les nettoyer, les contextualiser, puis de les charger de la façon adéquate. Nous verrons par la suite ce que chaque mot veut dire.
Il est important de savoir que la réalisation de l'ETL constitue 70% d'un projet décisionnel en