Contactez-nous
Stockage des données
Optimisation des bases de données
H3702 v1 Article de référence

Stockage des données
Optimisation des bases de données

Auteur(s) : Anne DOUCET, Hubert NAACKE

Date de publication : 10 août 2007 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Architectures des SGBD

  • 1.1 - Architecture client/serveur
  • 1.2 - Bases de données parallèles
  • 1.3 - Bases de données réparties
  • 1.4 - Entrepôts de données

2 - Modèle de données

3 - Stockage des données

4 - Méthodes d’accès

5 - Requêtes SQL

  • 5.1 - Réécriture algébrique
  • 5.2 - Optimisation de requêtes basée sur le coût
  • 5.3 - Exécution du plan
  • 5.4 - Optimisation des requêtes non SQL

6 - Transactions

7 - Conclusion

Sommaire

Présentation

RÉSUMÉ

Un système de gestion de bases de données (SGBD) s’évalue par ses performances et sa facilité d’usage. L’optimisation dans les SGBD est un aspect crucial des bases de données. Elle se situe à tous les niveaux : lors de la conception de l’application, où le choix de l’architecture du système, du modèle de données, des techniques de stockage et des méthodes d’accès aux données jouent un rôle important tant sur le plan de l’usage que sur celui de l’efficacité, et lors de l’utilisation où le temps de réponse aux requêtes et le nombre de transactions par seconde représentent les critères majeurs de performances.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Anne DOUCET : Professeur, université Pierre-et-Marie-Curie (Paris-6)Laboratoire d’informatique de Paris-6

  • Hubert NAACKE : Maître de conférences, université Pierre-et-Marie-Curie (Paris-6)Laboratoire d’informatique de Paris-6

INTRODUCTION

Un système de gestion de bases de données (SGBD) s’évalue par ses performances et sa facilité d’usage. L’optimisation dans les SGBD, qui a pour objectif de fournir aux utilisateurs un système optimal en termes de coût et d’usage, est un aspect crucial des bases de données. Elle se situe à tous les niveaux : lors de la conception de l’application, où le choix de l’architecture du système, du modèle de données, des techniques de stockage et des méthodes d’accès aux données jouent un rôle important tant sur le plan de l’usage que sur celui de l’efficacité, et lors de l’utilisation où le temps de réponse aux requêtes et le nombre de transactions par seconde représentent les critères majeurs de performances.

Pour évaluer les performances d’un système, il est nécessaire de définir des métriques. Celles‐ci s’appuient sur différents critères, en fonction du type d’optimisation. Il peut s’agir par exemple du temps de réponse ou de l’expressivité du langage pour les requêtes, de l’espace disque occupé et du temps de parcours des données d’une relation pour le choix d’une technique de stockage, de la disponibilité des ressources ou de l’extensibilité du système lorsqu’il s’agit d’une architecture.

Ce dossier est destiné aux lecteurs ayant une connaissance générale des fonctionnalités des bases de données (modèle relationnel, SQL, transactions et contrôle de concurrence). La lecture préalable des dossiers « Bases de données. Introduction » , « Bases de données relationnelles » et « Langages de bases de données : SQL et les évolutions vers l’objet » est recommandée.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h3702

Lecture en cours
Présentation

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

3. Stockage des données

Les données sont stockées durablement dans une mémoire de masse, généralement un disque dur (voir Périphériques de stockage magnétique et optique ). Les données sont rangées sur des pistes circulaires concentriques découpées en plusieurs secteurs. Un bloc est formé de plusieurs secteurs contigus de la même piste et correspond à la quantité élémentaire d’information pouvant être lue ou écrite en une seule opération. La taille d’un bloc, généralement 4 ko, est fixée lors du formatage du disque et est indépendante des spécificités de la base de données.

Le temps d’accès à un bloc quelconque dépend de la durée de déplacement radial de la tête de lecture vers la piste, de la rotation du disque jusqu’à ce que le premier secteur à lire soit placé sous la tête et du temps de lecture des secteurs. Les performances d’un disque dur se mesurent avec deux valeurs : la latence correspond au temps moyen de déplacement de la tête de lecture vers une page quelconque, et le débit correspond au nombre de blocs consécutifs pouvant être lus en une unité de temps.

Pour accéder rapidement à des données stockées sur plusieurs blocs, il est important que ces blocs soient proches entre eux. L’accès à des blocs consécutifs est rapide car la tête est déjà bien positionnée en fin de chaque bloc pour lire le bloc suivant. Le gain obtenu peut être d’un facteur 10 par rapport à la lecture de blocs dispersés aléatoirement sur le disque.

Le module de gestion de l’espace disque manipule des données organisées en pages. Une page correspond généralement à un seul bloc de disque afin d’accéder à une page en une seule opération. Le[nbsp ]rôle du gestionnaire consiste à trouver un espace libre sur le disque pour stocker une nouvelle page, et à libérer l’espace occupé par une page supprimée. Il est important, pour accélérer l’accès, que les pages lues fréquemment ensemble soient stockées dans des blocs consécutifs. Or, les données sont rarement insérées dans l’ordre des accès ultérieurs. Ainsi, le gestionnaire...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Stockage des données

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) -   Oracle Real Application Clusters 10g : Technical White Paper.  -  Oracle (2005).

  • (2) - ÖZSU (T.), VALDURIEZ (P.) -   Principles of Distributed Database Systems.  -  Prentice Hall (1999).

  • (3) -   SQL Server 2005 Analysis Services, MDX Multidimensional Expressions.  -  Microsoft (2005).

  • (4) -   Oracle OLAP 10g Data Sheet.  -  Oracle (2004).

  • (5) - GARDARIN (G.) -   Bases de données.  -  Eyrolles (1999).

  • (6) - RAMAKRISHNAN (R.), GEHRKE (J.) -   Database Management Systems.  -  McGraw-Hill (2002).

  • (7) - GARCIA-MOLINA (H.), ULLMAN (J.), WIDOM (J.) -   Database Systems : The Complete...

NORMES

  • Technologies de l’information. Langage de base de données SQL - NF ISO/CEI 9075 - 9-94

1 Logiciels

(liste non exhaustive)

UDB, DB2, IBM

http://www.ibm.com/db2

SQL Server 2005, Microsoft

http://www.microsoft.com/france/sql/sql2005/

Oracle Database

http://www.oracle.com/global/fr/

ASM d’Oracle 10g

http://www.oracle.com/technology/products/database/asm/

MySQL, logiciel libre

http://dev.mysql.com/

PostgreSQL, logiciel libre

http://www.postgresql.org/

HAUT DE PAGE

2 Organismes

Transaction Processing Performance Council (TPC)

http://www.tpc.org/

World Wide Web Consortium (W3C)

http://www.w3.org/

HAUT DE PAGE
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Digital Media Asset Management : fonctions centrales

La mise en place d’un Digital Media Asset Management (appelé DMAM) permet la gestion des médias ...

Cloud Storage

La révolution des sciences de l’information oblige à des questions nouvelles. Comment stocker des ...

Digital Media Asset Management : fonctions amont

L’évolution des médias vers le tout numérique impose la mise en œuvre d’un  Digital Media Asset ...

Indexation et archivage de contenus multimédias

L'indexation consiste à caractériser le contenu d'un document et l'information qu'il détient de manière ...