Contactez-nous
Constitution d’un entrepôt
Entrepôts de données
H3870 v1 Article de référence

Constitution d’un entrepôt
Entrepôts de données

Auteur(s) : Claude CHRISMENT, Geneviève PUJOLLE, Franck RAVAT, Olivier TESTE, Gilles ZURFLUH

Relu et validé le 28 avr. 2016 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Sommaire

Présentation

RÉSUMÉ

Cet article traite des bases de données spécifiques, nommées entrepôts de données et utilisées par les applications d’aide à la décision. L’exploitation des entrepôts de données obéit à des procédures particulières qui les différencient des bases de données. L’extraction des données d’un entrepôt réclame une sélection des données pertinentes de par la grande diversité des sources. Leur structuration impose des modèles tridimensionnels, et leur manipulation nécessite des logiciels d’analyse de données.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

INTRODUCTION

Les entrepôts de données (ou « data warehouse ») sont des bases de données (BD) spécifiques utilisées par les applications d’aide à la décision.

La mise en place et l’exploitation d’un entrepôt au sein d’une entreprise suivent des processus particuliers, distincts des démarches utilisées pour l’élaboration des BD.

En ce qui concerne l’extraction des données, les entrepôts sont alimentés à partir de sources de données diverses telles que des BD, des fichiers et des documents web. Il convient de s’assurer de la cohérence de l’ensemble de ces données et de permettre leur mise à jour régulière (rafraîchissement) en accord avec les besoins des décideurs.

La structuration de l’entrepôt doit être adaptée à l’usage que l’on en fait. Les modèles de données utilisés pour structurer et manipuler les BD classiques sont généralement inadaptés aux entrepôts ; de nouveaux modèles multidimensionnels ont été proposés pour offrir aux décideurs une représentation simple des données.

La manipulation des données d’un entrepôt s’effectue souvent au travers de logiciels d’analyse de données. C’est pourquoi les données doivent être sélectionnées selon certains critères ou certaines dimensions grâce à des opérateurs ad hoc qui les agrègent ou, au contraire, les répartissent selon les axes d’étude.

Enfin, l’évolution de l’entrepôt n’est pas uniquement liée aux extractions des données qu’il reçoit régulièrement des sources. Son schéma peut aussi être modifié au fil du temps pour s’adapter à l’évolution des processus d’analyse.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h3870

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(237 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

4. Constitution d’un entrepôt

Si la nécessité de constituer un entrepôt peut paraître évidente dans le cadre de la mise en œuvre d’un système décisionnel de l’entreprise, le premier écueil rencontré concerne la méthode à employer.

Nous présentons ici quelques éléments méthodologiques dans les principales étapes permettant de concevoir et mettre en œuvre un entrepôt.

Les méthodes utilisées pour le développement des traitements transactionnels s’avèrent globalement inadaptées, notamment les démarches en cascade ou en V. Notons cependant que certains de leurs modèles ou étapes peuvent être avantageusement réutilisés dans le développement des systèmes décisionnels.

Par exemple, la méthode MERISE ou le processus unifié (basé sur UML) proposent une démarche pour définir et implanter données et traitements. Le point de départ d’un tel processus est constitué par les besoins spécifiés par les utilisateurs opérationnels, toujours identifiables et généralement clairement définis. Le résultat est un logiciel fermé pour l’utilisateur, sorte de boîte noire activée chaque fois que la fonction qu’il assure est sollicitée par un événement.

Le cas des traitements décisionnels est différent. Il s’agit généralement de traitements non structurés, peu ou pas répétitifs et évolutifs.

Exemple

lors de la définition d’un plan de recrutement, extraire des indicateurs des données opérationnelles concernant les fonctions et âges des salariés de l’entreprise.

Les décideurs doivent donc être capables d’accéder eux-mêmes aux données du système d’information et d’effectuer les traitements qui leur seront nécessaires au moment où ils en exprimeront le besoin.

Notons que la spécificité des traitements décisionnels exige une démarche itérative comportant des cycles courts. Certains professionnels disent qu’il faut voir grand mais faire petit à petit.

En effet, la constitution d’un entrepôt de données principal (unique) représente un investissement trop important pour une équipe d’informaticiens au sein d’une entreprise ; il est donc nécessaire d’étaler l’activité correspondante sur plusieurs années.

Commencer par le développement d’un projet pilote, unanimement...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Constitution d’un entrepôt

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(237 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - AGRAWAL (R.), GUPTA (A.), SARAWAGI (S.) -   Modeling Multidimensional Databases  -  . Research Report, IBM Almaden Research Center, San Jose, Californie (1995). Paru dans les actes de ICDE’97.

  • (2) - GYSSEN (M.), LAKSHMANAN (L.V.S.) -   A Foundation for Multi-Dimensional Databases  -  . 23rd International Conference on Very Large Data Bases – VLDB’97, Athènes, Grèce (25 au 29 août 1997).

  • (3) - INMON (W.H.) -   Building the Data Warehouse  -  . Wiley (2002).

  • (4) - KIMBALL (R.), ROSS (M.) -   Entrepôts de données. Guide pratique de modélisation dimensionnelle  -  . Vuibert (2003).

ANNEXES

  1. 1 Logiciels

    1 Logiciels

    Cette liste n’est pas exhaustive.

    Oracle http://www.oracle.com

    ...
    Logo Techniques de l'Ingenieur

    Cet article est réservé aux abonnés.
    Il vous reste 95 % à découvrir.

    Pour explorer cet article Consulter l'extrait gratuit

    Déjà abonné ?


    Article inclus dans l'offre

    "Technologies logicielles Architectures des systèmes"

    (237 articles)

    Une base complète d’articles

    Actualisée et enrichie d’articles validés par nos comités scientifiques.

    Des contenus enrichis

    Quiz, médias, tableaux, formules, vidéos, etc.

    Des modules pratiques

    Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

    Des avantages inclus

    Un ensemble de services exclusifs en complément des ressources.

    Voir l'offre

    Ressources documentaires

    Transposition d'un modèle objet dans un contexte relationnel

    La maîtrise des systèmes d'information de plus en plus complexes impose aux entreprises la résolution de ...

    Spécifications fonctionnelles - Génération automatique de code

    Cet article s’interroge sur l’aptitude des modèles de spécification à générer un code exécutable. Il ...

    Langage UML : développement de logiciel et modélisation visuelle

    Le langage UML (pour Unified Modeling Language) est un langage graphique de modélisation des systèmes ...

    Validation des algorithmes en UML et OCL

    Cet article traite de propriétés formelles des langages de programmation dont le but est de vérifier, ...