Du CPU au GPGPU
Calcul généraliste sur carte graphique - Du rendu au calcul massivement parallèle
TE5990 v1 Archive

Du CPU au GPGPU
Calcul généraliste sur carte graphique - Du rendu au calcul massivement parallèle

Auteur(s) : Guillermo B. ANDRADE

Date de publication : 10 févr. 2010

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Du CPU au GPGPU

  • 1.1 - Évolution du CPU vers le parallélisme
  • 1.2 - Évolution des cartes graphiques

2 - Architectures actuelles NVIDIA et ATI/AMD pour le calcul généraliste

3 - Langages de programmation de haut niveau

4 - Programmation avec CUDA

5 - Évolutions

  • 5.1 - Matériels
  • 5.2 - Abstractions logicielles

Sommaire

Présentation

RÉSUMÉ

Cet article s'intéresse à la programmation des cartes graphiques dans le but de réaliser des calculs. D'abord, est décrite l'évolution des processeurs vers le parallélisme, et celle des cartes graphiques vers la programmation généraliste et le calcul massivement parallèle. Ces avancées poussent à s'intéresser aux cartes graphiques comme outils d'accélération des calculs, mais aussi comme objet d'entraînement pour la programmation des futures architectures des PC. Les principales architectures des cartes graphiques et les outils logiciels disponibles pour les programmer sont exposées. Une description plus détaillée des cartes NVIDIA et du langage de programmation CUDA est effectuée, suivie d'un exemple de programmation et d'optimisation. Pour finir, un aperçu des résultats obtenus et des évolutions techniques possibles est donné.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Guillermo B. ANDRADE : Docteur en informatique - Ingénieur de recherche à l'Institut National de Recherche en Informatique et Automatique (INRIA) de Rennes Bretagne Atlantique

INTRODUCTION

L'évolution des cartes graphiques ces dernières années se caractérise par un parallélisme massif et par la généricité de programmation.

Augmenter le parallélisme a permis une augmentation du débit du rendu à la fois par la multiplication de la fréquence d'images générées et par accroissement en taille de ces dernières. La généricité a facilité l'émergence de nouveaux effets de rendu en temps réel grâce à l'apparition de composants programmables comme les unités de pixelisation programmables (programmable pixel shaders units).

Ces deux facteurs réunis ont rendu les cartes graphiques actuelles très attractives pour réaliser des calculs intensifs dépassant le cadre du rendu visuel. La puissance de crête d'une des nouvelles cartes dépasse celle de certains super-calculateurs pour un prix de quelques centaines d'euros ! C'est l'émergence d'une nouvelle technique appelée programmation généraliste de cartes graphiques (GPGPU, General-Purpose computation on Graphics Processing Units).

Le GPGPU est soutenu par les constructeurs des cartes graphiques comme NVIDIA et ATI/AMD qui y voient un nouveau marché pour leurs produits haut de gamme. Ils ont introduit des langages de haut niveau et des environnements de développement facilitant l'accès aux non spécialistes. Aujourd'hui, le calcul massivement parallèle se démocratise. L'évolution des processeurs des ordinateurs s'oriente aussi vers le parallélisme. Il est donc possible que les techniques du GPGPU d'aujourd'hui deviennent les bases de la programmation des PC de demain.

Cet article donne les clefs pour comprendre comment utiliser les cartes graphiques pour augmenter la puissance utile de calcul des ordinateurs. Une première partie est consacrée à l'évolution des cartes graphiques qui permettent de faire du GPGPU. Dans une deuxième partie, une description des architectures actuelles permet au lecteur de saisir les qualités et limitations des cartes graphiques pour le calcul. La troisième partie décrit les principaux langages de programmation orientés pour le calcul des cartes graphiques. Un exemple concret dans la quatrième partie permettra au lecteur d'apercevoir les enjeux de ces techniques et va l'aider à comprendre quel type de calcul est possible d'y être porté avec un bon retour d'investissement. La dernière partie décrit les évolutions à venir qui permettront une convergence plus forte entre CPU (Computer Processor Unit) et GPU (Graphic Processor Unit), ainsi que les évolutions de la couche logicielle en vue d'une standardisation de la programmation pour assurer la portabilité des développements.

Les références entre crochets sont développées dans la rubrique Pour en savoir plus.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


VERSIONS

Il existe d'autres versions de cet article :

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-te5990

Article inclus dans l'offre

"Électronique"

(238 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

1. Du CPU au GPGPU

Cette partie traite des évolutions des CPUs et des GPUs qui motivent l'intérêt actuel pour le calcul sur carte graphique. Ainsi, le CPU a évolué vers le parallélisme et le GPU est devenu programmable et massivement parallèle. Ce qui pousse les développeurs à s'intéresser de nouveau à la programmation parallèle après les années de la « connection machine » .

1.1 Évolution du CPU vers le parallélisme

Le nombre d'opérations en virgule flottante par secondes (FLOPS) ou le nombre d'instructions par secondes (MIPS) qu'un processeur peut faire sont des indicateurs de sa puissance de calcul théorique. Dans les architectures synchrones de la quasi-totalité des processeurs commercialisés, les MIPS ou les FLOPS sont directement proportionnels à la fréquence de fonctionnement du processeur. C'est pourquoi les constructeurs de processeurs ont affiché la croissance importante des fréquences comme un argument de l'amélioration de la performance de leurs produits.

HAUT DE PAGE

1.1.1 Limites de la fréquence de fonctionnement du CPU

La fréquence de fonctionnement des CPUs vendus a atteint un sommet avec le processeur Intel Pentium Extreme Edition 965 qui tournait à 3,73 Ghz et avait une dissipation thermique maximale de 132 Watts. Malgré cette fréquence de fonctionnement très élevée, ce processeur était dans certains cas moins performant que le processeur Athlon 64 FX-60 pourtant tournant seulement à 2,6 Ghz avec une dissipation thermique inférieure à 125 Watts.

Aujourd'hui, ni Intel ni AMD ne cherchent plus à augmenter la puissance de calcul avec la seule augmentation de la fréquence.

Outre les problèmes techniques que cela impose, cette augmentation entraîne un accroissement de dissipation thermique qui n'est plus soutenable pour les salles de serveurs et pour les machines de bureau dans un contexte de maîtrise énergétique.

...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Du CPU au GPGPU

Article inclus dans l'offre

"Électronique"

(238 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - TUCKER (L.W.), ROBERTSON (G.G.) -   Architecture and applications of the connection machine.  -  IEEE Comput., vol. 21, p. 26-38 (1988).

  • (2) - GUIDON (Y.) -   Soufflerie numérique. Simulation de l'écoulement de gaz dans une soufflerie.  -  Pascalissime, no 64, p. 16-42 (1996).

  • (3) - NYLAND (L.), HARRIS (M.), PRINS (J.) -   Fast N-body simulation with CUDA.  -  Addison-Wesley Educational Pub., ISBN 978-0321515261, Chapitre 31, GPU Gems 3 (2007).

  • (4) - GÖDDEKE (D.) et al -   Co-processor acceleration of an unmodified parallel solid mechanics code with FEASTGPU.  -  Inter. Jour. of Computational Sci. and Engineering (2009).

  • (5) - BRANDVIK (T.), PULLAN (G.) -   Acceleration of a 3D Euler Solver using commodity graphics hardware.  -  46th AIAA Aerospace Sciences Meeting and Exhibit (2008).

  • (6) - PREIS (T.), VIRNAU (P.), WOLFGANG (P.), SCHNEIDER (J.J.) -   GPU...

DANS NOS BASES DOCUMENTAIRES

1 Sites Internet

HARRIS Mark General-Purpose Computation on Graphics Hardware http://gpgpu.org/ (page consultée le 20 septembre 2009). Le plus important site sur le sujet avec des actualités, forums et tutoriels.

GAVRICHENKOV Ilya Intel Pentium Extreme Edition 965 CPU Review http://www.xbitlabs.com/articles/cpu/display/pentium-ee-965_8.html (page consultée le 20 septembre 2009). Revue du processeur avec la fréquence la plus élévée en 2006.

NVIDIA Corporation CUDA Zone – The resource for CUDA developers http://www.nvidia.com/object/cuda_home.html (page consultée le 20 septembre 2009). Le site met à disposition une excellente documentation et des outils logiciels pour le développement d'applications utilisant CUDA et les cartes graphiques NVIDIA, ce site maintient une importante liste de références de résultats d'utilisations de cartes graphiques pour le calcul.

Advanced Micro Devices, Inc. AMD Developer Central – ATI Stream Software Development Kit (SDK) http://developer.amd.com/gpu/ATIStreamSDK/Pages/default.aspx (page consultée le 20 septembre 2009). Le site contient les informations et les outils nécessaires pour le développement d'applications utilisant Brook+ et les cartes graphiques ATI/AMD.

Khronos Group http://www.khronos.org/opencl/ (page consultée...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Électronique"

(238 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Programmation des systèmes parallèles hétérogènes

La technologie OpenCL a été créée dans le but de programmer des systèmes parallèles hétérogènes et de ...

Architectures reconfigurables FPGA

Les circuits FPGA (Field Programmable Gate Arrays) sont programmables, ou configurables, par ...

Introduction au parallélisme et aux architectures parallèles

Le parallélisme est dorénavant utilisé dans la majorité des architectures, des systèmes embarqués aux ...

Jeux d'instructions des processeurs

Les jeux d’instructions comprennent l’ensemble des instructions machine qui permettent à un processeur ...