Problèmes liés aux instructions à opérations multicycles
Processeurs : exécution pipeline des instructions

H1004 v1 Article de référence

Problèmes liés aux instructions à opérations multicycles
Processeurs : exécution pipeline des instructions

Auteur(s) : Daniel ETIEMBLE, François ANCEAU

Relu et validé le 04 mars 2022 | Read in English

Cet article est réservé aux abonnés

Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?Se connecter

Sommaire
Médias

Présentation

1 - Principe du pipeline

2 - Exécution pipeline des instructions simples

2.1 - Étapes de l'exécution d'une instruction

Tableau 1
2.2 - Exécution des instructions par le matériel

Figure 5 - Phase LI-CP Tableau 2
2.3 - Pipeline cinq étages du MIPS R2000
2.4 - Pipeline et dépendances de données
2.5 - Pipeline et dépendances de contrôle
2.6 - Prédiction de branchement
2.7 - Pipeline du processeur Intel i486

Tableau 3 Tableau 4 Tableau 5 Tableau 6
2.8 - Problème des interruptions

Figure 23 - Pipeline et superpipeline
2.9 - Superpipelines

Tableau 7

3 - Problèmes liés aux instructions à opérations multicycles

3.1 - Opérations multicycles
3.2 - Dépendances de données

Figure 31 - Code DAXPY Figure 33 - Pipeline logiciel
3.3 - Terminer ou non les instructions dans l'ordre

4 - Conclusion

RÉSUMÉ

Cet article présente les caractéristiques essentielles de l'exécution pipeline des instructions dans les processeurs. Avec les exemples des pipelines du MIPS 2000 et de l'Intel i486, il montre la décomposition des instructions en étapes élémentaires et leur exécution par le matériel. Il présente le traitement des dépendances de données et de contrôle pour les instructions simples, mais aussi pour celles dont la partie calcul nécessite plusieurs cycles d'horloge. Les techniques matérielles de contrôle des dépendances,et les techniques logicielles pour supprimer ou réduire les suspensions, sont présentées, ainsi que les problèmes des interruptions et de terminaison non ordonnée des instructions.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

Daniel ETIEMBLE : Ingénieur INSA Lyon - Professeur à l'Université Paris Sud
François ANCEAU : Ingénieur INPG Grenoble - Professeur émérite au CNAM

INTRODUCTION

L'objectif de cet article est de présenter les caractéristiques essentielles de l'exécution pipeline des instructions dans les processeurs, qui est la technique la plus simple d'amélioration des performances employée depuis la fin des années 1950 en permettant qu'une nouvelle instruction commence son exécution alors que les précédentes sont encore en cours d'exécution. Ce recouvrement dans le temps de l'exécution de plusieurs instructions a évolué au cours du temps : les machines anciennes comme l'IBM 360/91 et les processeurs d'Intel jusqu'au 80 386 utilisaient un pipeline « lâche ». Avec l'arrivée de la technologie RISC dans les années 1980, les pipelines des processeurs sont devenus « serrés », les notions « lâche » et « serré » étant précisées dans l'article.

Le traitement pipeline des instructions simples, celles dont les opérations dans l'unité de calcul sont exécutées en un cycle d'horloge, est examiné en détail. Le pipeline du MIPS R2000 est pris comme exemple, avec la manière dont les instructions sont décomposées en étapes élémentaires et exécutées par le matériel. Le traitement des dépendances de données et des dépendances de contrôle est explicité, avec notamment le problème des branchements et des interruptions. Le pipeline d'un processeur CISC, l'Intel i486, est également abordé.

Les opérations de multiplication et de division sur les données entières et toutes les opérations de calcul flottant ne peuvent s'exécuter dans la durée du cycle d'horloge des opérations arithmétiques et logiques simples. Cette situation complique le traitement pipeline des instructions en introduisant des dépendances de données plus complexes : vraies dépendances, antidépendances et dépendances de sortie. Les techniques de contrôles des vraies dépendances sont présentées. Si elles garantissent un fonctionnement correct, elles peuvent introduire des suspensions. Des techniques logicielles, comme le déroulage de boucle ou le pipeline logiciel, permettent de réduire ou supprimer ces suspensions. Les antidépendances et les dépendances de sortie peuvent être supprimées par la technique de renommage de registres. Le problème de la terminaison non ordonnée des instructions est également abordé.

Pour améliorer les performances, le pipeline a été la technique privilégiée pour les processeurs haut de gamme jusqu'au milieu des années 1990. Il reste la technique privilégiée pour les processeurs des applications enfouies et embarquées lorsque le compromis performance – surface silicium – énergie est plus important que la seule performance. Il n'a montré sa pleine potentialité qu'avec l'émergence de nouvelles techniques, comme l'exécution « data flow » de code séquentiel classique ou l'exécution VLIW qui permettent de mieux exploiter le parallélisme d'instructions existant dans les codes séquentiels classiques.

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ? Se connecter

MOTS-CLÉS

Pipeline Superpipeline Renommage de registres

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h1004

Lecture en cours
Présentation

Page
suivante

Conclusion

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(235 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

3. Problèmes liés aux instructions à opérations multicycles

3.1 Opérations multicycles

Toutes les opérations exécutées dans l'UAL considérées jusqu'à maintenant s'exécutent en un cycle d'horloge. Les instructions logiques travaillent au niveau de chaque bit et n'ont pas de retenue à propager. Les opérations arithmétiques simples sur des données en représentation entière (addition et soustraction) sont exécutables en un cycle d'horloge. Par contre, les opérations de multiplication et de division sur les données entières sont des opérations longues, qui nécessitent plusieurs cycles d'horloge. Il y a deux manières d'effectuer par matériel une multiplication.

La première consiste en une suite d'additions et de décalage contrôlés par un séquenceur, chaque étape nécessitant un cycle d'horloge. Cette approche, avec éventuellement des variantes permettant de traiter plusieurs bits du multiplicateur à la fois pour réduire le nombre d'itérations, était utilisée dans les processeurs anciens ou est utilisée dans des processeurs bas de gamme. Avec cette approche séquentielle, le multiplieur ne peut effectuer qu'une opération à la fois, c'est-à-dire qu'une multiplication doit être terminée avant de pouvoir commencer la suivante. La seconde approche effectue les multiplications de manière combinatoire.

Se reporter à l'article [E 180] pour une description rapide de ces multiplieurs combinatoires utilisant l'algorithme de Booth et les arbres de Wallace.

Si le traitement combinatoire est découpé en plusieurs étapes, séparées par des registres, la multiplication peut être pipelinée. La multiplication prend plusieurs cycles d'horloge, mais une nouvelle opération peut commencer à chaque cycle d'horloge. La division est effectuée de manière séquentielle, l'algorithme SRT permettant de traiter deux bits du diviseur à la fois.

Toutes les opérations en virgule flottante nécessitent plusieurs cycles d'horloge. Comme déjà indiqué avec le cas du multiplieur, on distingue les opérations qui utilisent un opérateur...

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.