BI

Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2013-2014 Contexte et problématique Le processus de prise de décision L’entrepôt de donné Définition or 11 Sni* to View Différence avec un SGBD Caractéristiques Architecture d’un système décisionnel Modélisation multidimensionnelle différentes bases de données) C] En extrayant, groupant, organisant, corrélant et transformant (résumé, agrégation) les données 6 Problématique (3) Mettre en place un SI dédié aux applications décisionnelles : un entrepôt de données (datawarehouse)

D Transformer des données de production en informations stratégiques 7 Sources : Th.

Ester, HEC Lausanne Le processus de prise de décision (1) Sources : Lydie Soler, AgroTechParis Le processus de prise de décision (2) L’entrepôt : Définition Le DW est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le su art d’un processus d’aide à la PAGF70F11 14 Sources : Lydie Soler, AgroTechparis Caractéristiques d’un DW (1) Données orientées sujet Cl Regroupe les informations des différents étiers Ne tiens pas compte de l’organisation fonctionnelle des données Caractéristiques d’un DW (2) Données intégrées Normalisation des données Cl Définition d’un référentiel unique 16 Caractéristiques d’un DW (3) Données non volatiles PAGF30F11 dimension a des caractéristiques propres et est en général textuel Remarque importante • tables de dimension «

Désolé, mais les essais complets ne sont disponibles que pour les utilisateurs enregistrés

Choisissez un plan d'adhésion
Table de fait 25 Dimension (2) Clé de substitutlon Attributs de la dimension Dimension produit Clé produit (CP) Code produit Description du produit Famille du produits Marque Emballage Poids 26 Hiérarchie (1) Les attributs/membres d’une dimension sont organisés suivant des hiérarchies Chaque membre appartient à un n d 1 ique Découpage administratif. La table de fait contient les valeurs des mesures et les clés vers les tables de dimensions 31 Mesure Élément de donnée sur lequel portent les analyses, en fonction des différentes dimensions.

Ces valeurs sont le résultat d’opérations d’agrégation sur les données Exemple : Coût des travaux Cl Nombre d’accidents Ventes 32 Clés Tables de dimenslon Clé primaire s 1 onnées sont stockées comme des matrices ? plusieurs dimensions : Cube[l Accès direct aux données dans le cube Avantages : Inconvénients : Rapidité Difficile à mettre en place Formats souvent propriétaires Ne supporte pas de rtès gros volumes de données Exemple de moteurs MOLAP : Microsoft Analysis Services Hyperion 42 6 1 instructions SQL classiques CREATE TABLE AS : recopie physique, ? reprendre intégralement lors de févolution des sources Cl CRÉATE VIEW AS : recalculé à chaque requête, temps de réponse inacceptable sur les volumes manipulés Optimisation : Indexes, 51 Réalisation d’un DW Évolution des besoins et des sources démarche itérative 3 techniques : Top-down [Inmon] Cl Bottom-up [Kimball] Middle-out 52 Top-Down itérative D Développement d’une infrastructure lourde qu’en cas de nécessité n implique, parfois, des compromis de découpage (dupliquer des dimensions identiques pour des besoins pratiques). 55 Ne pas oublier… (1) Le volume de données manipulées 56 Ne pas oublier… (2) Voici 5 étapes importantes pour la réalisation d’un DW : Conception Acquisition des données

Définition des aspects techniques de la réalisation Définition des modes de restitution Stratégies d’administration, évolution maintenance B1 envoyées C] Difficulté et répétée Ne pas perturber les applications OLTP 61 Transformation : Etape très importante qui garantit la cohérence et la fiabilité des données Cl Rendre cohérentes les données issues de différentes Unifier les données Trier, Nettoyer PAG » 1 mettre en place pour l’administration, l’évolution et la • fréquences des rafraichissements (global ou plus fin? ) 68 Représentation et manipulation (1) Le cube de données C] est tradltionnellement représenté sous forme de table multidimensionnelle et manipulé via différents opérateurs 69 Représentation et manipulation (2) La table multidimensionnelle n Présente les valeurs des mesures d’un fait en fonction des valeurs des paramètres des dimensions représentees en lignes et en colonnes étant données des valeurs des autres dimensions les lignes et les colonnes sont les axes selon lesquels le cube est exploré et chaque cellule contient la (ou les) mesure(s) calculée(s). correspond 11