Professeur
Mise en œuvre de l’ETL TALEND
----------------------------------------------------------------------------------------------------
L'objectif du cas "Best-Wine", est d’aider un caviste au pilotage de son activité.
L’outil préconisé pour la mise en oeuvre de votre projet est la suite TALEND.
Description du cas
Un caviste, du nom de "Best-Wine", souhaite mettre en place un système de reporting sur son portefeuille clients, et le suivi de son activité.
Il a à sa disposition son catalogue de référence avec les prix réactualisés tous les ans, son fichier client, et l'historique de ses ventes.
Le caviste souhaite répondre aux questions suivantes :
- Qui sont mes clients ? Quelles sont leurs caractéristiques ?
- Quel est mon chiffre d’affaire ?
- Quels sont les clients ayant la plus grande cave en nombres de bouteilles ? En ancienneté des crus ?
- Quels sont les clients ayant constitués leur cave le plus rapidement ?
- Quels sont les clients ayant réalisés la plus forte plus-value réalisée (plus value = différence entre investissement de départ et valorisation actuelle) ?
- …
Les fichiers fournis sont de type ascii avec séparateur « ; » et une ligne d’entête descriptive.
Clients.txt => Fichier client
Catalogue{N° Groupe}.txt => Catalogue des références, avec les prix depuis 1990 à 2009
Ventes{N° Groupe}.txt => Fichier des ventes par date et par quantité.
Ventes.txt
REF_CLIENT
REF_VIN
…
Client.txt
REF_CLIENT
…
Catalogue.txt
REF_VIN
…
Résultats attendus
1/ Modélisation
- Proposer une modélisation pour stocker et exploiter ces informations, et répondre facilement aux questions du caviste. Expliquer votre choix.
2/ Process ETL
- Quelles sont les difficultés rencontrées, lors du chargement ? (qualité, complétude, unicité, cohérence, intégrité, conformité...). Illustrer par l'exemple, quelques cas représentatifs ?
- Comment les avez-vous contournées ? Quelle solution