3. Extraction des sources
Les entrepôts de données sont alimentés à partir de sources multiples, autonomes (gérées par des systèmes différents et indépendants), hétérogènes (du point de vue structurel ou sémantique), éventuellement peu structurées (données semi-structurées) ou non.
Une première démarche pour construire un entrepôt à partir de telles sources consiste à écrire pour chacune un programme ad hoc réalisant la sélection des données pertinentes de la source pour les adapter aux exigences du système qui gère l’entrepôt de données. Cette démarche est particulièrement contraignante notamment pour le rafraîchissement de l’entrepôt ainsi que pour s’adapter à ses évolutions.
Une démarche intermédiaire pour s'accorder avec plus de souplesse à l’hétérogénéité des systèmes qui gèrent les sources tout en préservant leur autonomie, consiste à générer pour chaque source (rôle de l’adaptateur) une image dans un modèle compatible avec celui de l’entrepôt. Un processus générique d’unification permet ensuite l’alimentation de l’entrepôt. Généralement,...
La suite de cet article est réservée aux abonnés
Vous n'êtes pas abonné ?
Consultez gratuitement cet article.
votre période de consultation gratuite
Découvrez le plus important corpus scientifique et technique francophone
Plus de 8 000 articles, 13 univers, 400 bases documentaires, les plus grands auteurs, un enrichissement permanent et un éventail de services associés.
