Remarques pour conclure
Codage des nombres dans les ordinateurs

H1210 v1 Article de référence

Remarques pour conclure
Codage des nombres dans les ordinateurs

Auteur(s) : Daniel ETIEMBLE

Date de publication : 10 nov. 2023 | Read in English

Cet article est réservé aux abonnés

Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?Se connecter

Sommaire
Médias

Présentation

1 - Introduction

2 - Représentation des nombres entiers

2.1 - Entiers non signés
2.2 - Entiers en complément à deux

Figure 3 - Entiers en complément à 2

3 - Multiplication d’entiers signés

4 - Division d’entiers signés

4.1 - Entiers en signe et valeur absolue
4.2 - Entiers en complément à 1
4.3 - Entiers en complément à 2 et jeux d’instructions

5 - Représentation virgule fixe

5.1 - Addition de deux nombres en virgule fixe
5.2 - Multiplication de deux nombres en virgule fixe
5.3 - Intérêt de la représentation virgule fixe

6 - Représentation virgule flottante

6.1 - Présentation générale
6.2 - Différents formats

Tableau 1
6.3 - Opérations arithmétiques

Tableau 2 Tableau 3 Tableau 4
6.4 - Formats flottants et jeux d’instructions
6.5 - Arrondis et problèmes associés

7 - Flottants par bloc

8 - Codage du décimal

8.1 - Décimal codé binaire

Tableau 5
8.2 - Instructions pour l’arithmétique décimale

9 - Flottants décimaux

10 - Format Posit

11 - Remarques pour conclure

Bibliographie & annexes

Présentation

RÉSUMÉ

Les processeurs ne travaillant que sur des chiffres binaires, un codage est nécessaire pour représenter les différents types de nombres. Les formats entiers et flottants traités par les processeurs généralistes sont présentés avec les opérations arithmétiques de base et la manière dont elles sont implantées dans les jeux d’instructions des processeurs. Des formats plus spécifiques (virgule fixe, décimal, flottants réduits, nombres Posit) sont aussi présentés et discutés.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

Daniel ETIEMBLE : Ingénieur de l’INSA de Lyon - Professeur émérite à l’université Paris Saclay

INTRODUCTION

Comme les processeurs et plus généralement les systèmes électroniques digitaux opèrent uniquement sur des chiffres binaires appelées bits, le traitement des nombres nécessite un codage.

Les différentes représentations impliquent plusieurs aspects :

la présentation des formats ;
les opérations arithmétiques de base (addition, soustraction, multiplication, division) avec les problèmes éventuels de dépassement de capacité ;
les instructions des jeux d’instructions pour les différentes opérations, avec les variantes selon les jeux d’instructions.

Les formats entiers sur n bits représentent des nombres entiers non signés ou signés. Si les nombres positifs ont toujours la même représentation, différentes représentations des nombres négatifs ont été définies : signe et valeur absolue, complément à 1, complément à 2, cette dernière étant la seule utilisée depuis des dizaines d’années. Pour les opérations sur les entiers, le nombre de bits en sortie est différent du nombre de bits en entrée. Une addition n bits + n bits fournit un résultat sur n+1 bits et une multiplication n bits * n bits fournit un résultat sur 2n bits. Le traitement des retenues (addition) ou des n bits de poids fort (multiplication) pose des problèmes à la fois pour les instructions scalaires et pour les instructions SIMD des différents jeux d’instructions.

Les formats flottants simple précision (32 bits) et double précision (64 bits) ont été normalisés depuis le milieu des années 1980 (IEEE 754). Ils sont présentés ainsi que des formats réduits 16 bits et 8 bits plus récents, utilisés dans les réseaux de neurones profonds. Les formats flottants par bloc et les flottants décimaux sont aussi présentés. Le format Posit, proposé par J.L. Gustafson comme alternative à l’utilisation des formats flottants IEEE 754, est présenté et discuté.

Alors que les formats entiers et flottants existant depuis des dizaines d’années sont utilisés dans les processeurs généralistes, des modèles de calcul comme ceux des réseaux de neurones et les problèmes de consommation énergétique ont conduit à l’apparition de formats réduits qui peuvent être ajoutés à certains jeux d’instructions d’usage général ou implantés dans des processeurs spécialisés, des IP, des FPGA, etc.

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ? Se connecter

MOTS-CLÉS

format entier format flottant format virgule fixe opérations arithmétiques BCD flottants 16 et 8 bits nombres Posit

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h1210

Lecture en cours
Présentation

Page
suivante

Introduction

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(234 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

11. Remarques pour conclure

Depuis des dizaines d’années, le codage des entiers 8, 16, 32 et 64 bits et des flottants 32 bits et 64 bits est implanté dans tous les processeurs d’usage général. Le format virgule fixe est utilisé surtout dans les processeurs de traitement du signal.

Depuis une dizaine d’années, de nouveaux formats sont utilisés, résultant de deux considérations :

les réseaux de neurones profonds, notamment pour l’inférence, peuvent bénéficier de formats réduits, permettant de diminuer la surface des opérateurs arithmétiques et la puissance dissipée, sans perte significative de précision. Certains de ces formats, comme les flottants 16 bits (FP16, BFP16) sont implantés dans des jeux d’instructions de processeurs généralistes. Le format TF32 est implanté dans les tenseurs des GPU récents de Nvidia ;
de nombreuses applications utilisent des processeurs spécialisés comme les processeurs neuronaux (Google TPU, ARM), des FPGA, ou des systèmes sur puce intégrant avec un processeur généraliste des opérateurs spécialisés réalisés sous forme d’IP (Intellectual Property). FPGA, IP ou processeurs spécialisés peuvent utiliser des formats de données, entières ou flottantes, différentes des formats classiques mieux adaptés aux besoins des applications tout en réduisant surface de puce et consommation énergétique.

C’est le problème de la consommation énergétique qui a conduit et conduit à définir ces nouveaux formats de données

HAUT DE PAGE

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.