1.1 - Bases de données et système d’information
1.2 - Des bases de données aux entrepôts de données

2 - ARCHITECTURE D’UN SYSTÈME DÉCISIONNEL

3 - EXTRACTION DES SOURCES

4.1 - Analyse des besoins
4.2 - Définition de l’entrepôt
4.3 - Choix des outils d’analyse

5 - MODÉLISATION MULTIDIMENSIONNELLE DES MAGASINS

5.1 - Nécessité de modèles adaptés
5.2 - Étude des modèles par niveau d’abstraction

Figure 6 - Cube de données

6 - ANALYSE DÉCISIONNELLE

6.1 - Contexte
6.2 - Outils de manipulation décisionnelle

Figure 11 - Typologie des magasins
6.3 - Algèbre multidimensionnelle

Figure 13 - Opérations de forage Figure 14 - Rotation de hiérarchies Tableau 1 - Opérateurs de transformation de la granularité des données Tableau 2 - Opérateurs de transformation de la structure des données

7 - L’EXEMPLE D’ORACLE

Bibliographie & annexes

Article de référence | Réf : H3870 v1

Extraction des sources
Entrepôts de données

Auteur(s) : Claude CHRISMENT, Geneviève PUJOLLE, Franck RAVAT, Olivier TESTE, Gilles ZURFLUH

Relu et validé le 28 avr. 2016

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Présentation

RÉSUMÉ

Cet article traite des bases de données spécifiques, nommées entrepôts de données et utilisées par les applications d’aide à la décision. L’exploitation des entrepôts de données obéit à des procédures particulières qui les différencient des bases de données. L’extraction des données d’un entrepôt réclame une sélection des données pertinentes de par la grande diversité des sources. Leur structuration impose des modèles tridimensionnels, et leur manipulation nécessite des logiciels d’analyse de données.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

Claude CHRISMENT : Professeur à l’université Toulouse-3
Geneviève PUJOLLE : Maître de conférences à l’université Toulouse-1
Franck RAVAT : Maître de conférences à l’université Toulouse-1
Olivier TESTE : Maître de conférences à l’université Toulouse-3
Gilles ZURFLUH : Professeur à l'université Toulouse-1

INTRODUCTION

Les entrepôts de données (ou « data warehouse ») sont des bases de données (BD) spécifiques utilisées par les applications d’aide à la décision.

La mise en place et l’exploitation d’un entrepôt au sein d’une entreprise suivent des processus particuliers, distincts des démarches utilisées pour l’élaboration des BD.

En ce qui concerne l’extraction des données, les entrepôts sont alimentés à partir de sources de données diverses telles que des BD, des fichiers et des documents web. Il convient de s’assurer de la cohérence de l’ensemble de ces données et de permettre leur mise à jour régulière (rafraîchissement) en accord avec les besoins des décideurs.

La structuration de l’entrepôt doit être adaptée à l’usage que l’on en fait. Les modèles de données utilisés pour structurer et manipuler les BD classiques sont généralement inadaptés aux entrepôts ; de nouveaux modèles multidimensionnels ont été proposés pour offrir aux décideurs une représentation simple des données.

La manipulation des données d’un entrepôt s’effectue souvent au travers de logiciels d’analyse de données. C’est pourquoi les données doivent être sélectionnées selon certains critères ou certaines dimensions grâce à des opérateurs ad hoc qui les agrègent ou, au contraire, les répartissent selon les axes d’étude.

Enfin, l’évolution de l’entrepôt n’est pas uniquement liée aux extractions des données qu’il reçoit régulièrement des sources. Son schéma peut aussi être modifié au fil du temps pour s’adapter à l’évolution des processus d’analyse.

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h3870

CET ARTICLE SE TROUVE ÉGALEMENT DANS :

Accueil > Ressources documentaires > Technologies de l'information > Technologies logicielles Architectures des systèmes > Big Data > Entrepôts de données > Extraction des sources

Cet article fait partie de l’offre

Technologies logicielles Architectures des systèmes

(238 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

Page
suivante

Constitution d’un entrepôt

3. Extraction des sources

Les entrepôts de données sont alimentés à partir de sources multiples, autonomes (gérées par des systèmes différents et indépendants), hétérogènes (du point de vue structurel ou sémantique), éventuellement peu structurées (données semi-structurées) ou non.

Une première démarche pour construire un entrepôt à partir de telles sources consiste à écrire pour chacune un programme ad hoc réalisant la sélection des données pertinentes de la source pour les adapter aux exigences du système qui gère l’entrepôt de données. Cette démarche est particulièrement contraignante notamment pour le rafraîchissement de l’entrepôt ainsi que pour s’adapter à ses évolutions.

Une démarche intermédiaire pour s'accorder avec plus de souplesse à l’hétérogénéité des systèmes qui gèrent les sources tout en préservant leur autonomie, consiste à générer pour chaque source (rôle de l’adaptateur) une image dans un modèle compatible avec celui de l’entrepôt. Un processus générique d’unification permet ensuite l’alimentation de l’entrepôt. Généralement, le modèle pivot utilisé pour les images est le modèle relationnel : il suffit généralement d’utiliser la fonction d’exportation de données intégrée au système de gestion de la source pour obtenir cette image. Ce processus se simplifie lorsque les sources sont relationnelles ou pseudo-relationnelles, et cette tâche peut être pilotée par des systèmes génériques avec des interfaces graphiques spécifiant les caractéristiques de l’image à partir de la source (voir l’environnement Oracle, § 7 ). À partir de cet ensemble d’images, on alimente soit directement les tables de l’entrepôt de données, soit les tables associées aux vues d’un système d’intégration de données (appelé aussi système médiateur), dans un schéma...

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Technologies logicielles Architectures des systèmes

(238 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Extraction des sources

Page
précédenteArchitecture d’un système décisionnel

Page
suivante

Constitution d’un entrepôt

BIBLIOGRAPHIE

(1) - AGRAWAL (R.), GUPTA (A.), SARAWAGI (S.) - Modeling Multidimensional Databases - . Research Report, IBM Almaden Research Center, San Jose, Californie (1995). Paru dans les actes de ICDE’97.
(2) - GYSSEN (M.), LAKSHMANAN (L.V.S.) - A Foundation for Multi-Dimensional Databases - . 23rd International Conference on Very Large Data Bases – VLDB’97, Athènes, Grèce (25 au 29 août 1997).
(3) - INMON (W.H.) - Building the Data Warehouse - . Wiley (2002).
(4) - KIMBALL (R.), ROSS (M.) - Entrepôts de données. Guide pratique de modélisation dimensionnelle - . Vuibert (2003).

DANS NOS BASES DOCUMENTAIRES

ANNEXES

1 Logiciels

1 Logiciels

Cette liste n’est pas exhaustive.

Oracle http://www.oracle.com

Requêteurs

Impromptu, Cognos http://www.cognos.com/impromptu

Business Objects, Business Objects SA http://www.businessobjects.com

Discoverer, Oracle http://www.oracle.com/technology/products/discoverer

Requêteurs avec rapport via un navigateur

WebIntelligence, Business Objects SA http://www.businessobjects.com

Impromptu Web Reports, Cognos http://www.cognos.com/impromptu

Outils d’analyse OLAP

Oracle OLAP, Oracle http://www.oracle.com/technology/products/bi/olap/olap.html

Microsoft SQL Server, Microsoft http://www.microsoft.com/sql

Outils graphiques d’analyse OLAP

PowerPlay, Cognos http://www.cognos.com/products/business_intelligence/analysis

Business Objects, Business Objects SA http://www.businessobjects.com

Outils ETL

Oracle Warehouse Builder, Oracle http://www.oracle.com/technology/products/warehouse

DataStage, Ascential http://www.ascential.com/products/datastage.html

...

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Technologies logicielles Architectures des systèmes

(238 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS