Glossaire
Processeurs à grand nombre de cœurs (manycores)
H1014 v1 Archive

Glossaire
Processeurs à grand nombre de cœurs (manycores)

Auteur(s) : Daniel ETIEMBLE

Relu et validé le 05 janv. 2021 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Sommaire

Présentation

RÉSUMÉ

Cet article présente les processeurs à très grand nombre de cœurs (manycores), avec les caractéristiques qui les distinguent des multicœurs et des GPU : type et performances des cœurs, décomposition hiérarchique en clusters de cœurs, modèle mémoire (partagée ou distribuée) et développements logiciels. Ils sont utilisés dans deux classes d’applications : le calcul scientifique haute performance pour lequel la performance est le critère clé, et les applications mobiles ou embarquées haute performance à faible consommation.

Quatre exemples sont détaillés : les Xeon Phi d’Intel, le SW26010 utilisé dans le superordinateur TaihuLight, les versions 16,64 et 1024 cœurs de l’architecture Epiphany d’Adapteva et lesmanycoresMMPA2 et MMPA3 de Kalray.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Daniel ETIEMBLE : Ingénieur de l’INSA de Lyon - Professeur émérite à l’université Paris Sud

INTRODUCTION

Sans prendre en compte les processeurs graphiques (GPU) qui constituent à eux seuls une classe d’architecture, les processeurs à grand nombre de cœurs se distinguent des processeurs multicœurs, non seulement par le nombre de cœurs, mais également par un certain nombre de caractéristiques : le type et la performance des cœurs, la décomposition hiérarchique en clusters (ou nœuds) de cœurs, le modèle mémoire (mémoire partagée ou mémoire distribuée) et les problèmes logiciels liés au fait qu’ils sont presque toujours utilisés comme coprocesseurs. Ces manycores sont utilisés dans deux grandes classes d’applications : celles, comme le calcul scientifique, pour lesquelles la haute performance est le critère le plus important d’une part, et les applications mobiles et embarquées haute performance pour lesquelles les contraintes énergétiques sont fondamentales, d’autre part.

Les différentes caractéristiques sont présentées avec les différentes variantes. Puis quatre exemples de processeurs manycores sont détaillés. Les deux premiers sont destinés au calcul haute performance et dissipent deux à trois centaines de watts :

  • les processeurs et coprocesseurs Xeon Phi d’Intel avec les modèles Knights Corner et Knights Landing ;

  • le manycore SW26010 utilisé dans le superordinateur chinois TaihuLight qui a été de Juin 2016 à Novembre 2017 le premier au TOP500 des superordinateurs.

Les deux exemples suivants sont des architectures destinées aux applications mobiles et embarquées haute performance et dissipent de quelques watts à trois dizaines de watts :

  • les processeurs implantant l’architecture Epiphany d’Adapteva, avec deux versions utilisées à 16 ou 64 cœurs et une version 1 024 cœurs qui semble être un échec ;

  • l’architecture MPPA de Kalray, avec notamment l’étude des versions MMPA2 et MPPA3.

L’approche Xeon Phi, utilisant la mémoire partagée et des cœurs non suffisamment simplifiés par rapport à ceux des multicœurs, a des performances insuffisantes par rapport aux processeurs graphiques, ce qui a conduit en 2018 à son abandon par Intel. Les manycores SW26010 et Pezy SC-2 utilisent une hiérarchisation de cœurs et la mémoire partagée. Ils sont utilisés dans des superordinateurs ayant les meilleures performances au monde. Les processeurs manycores destinés aux applications embarquées haute performance sont prometteurs. Si Adaptera n’utilise que les versions Epiphany 16 et 64 cœurs, Kalray, avec l’architecture MPPA3 dont la puissance dissipée reste de l’ordre de 20 W et avec ses extensions arithmétiques pour la vision par ordinateur et l’apprentissage profond, semble bien positionné dans cette classe d’applications.

Les processeurs manycores ne sont pas la continuité des multicœurs avec un plus grand nombre de cœurs. Le nombre de cœurs est très loin d’une progression exponentielle. Les nouvelles applications de l’intelligence artificielle semblent favoriser les manycores à faible consommation et les aider à trouver leur créneau dans les choix entre multicœur, GPU et FPGA.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


VERSIONS

Il existe d'autres versions de cet article :

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h1014

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

6. Glossaire

AVX (Advanced Vector Extension)

Caractérise des extensions SIMD dans le jeu d'instructions Intel 64 : les instructions AVX travaillent sur des registres et des mots mémoire de 256 bits, et les instructions AVX-512 sur des registres et des mots mémoire de 512 bits.

MOESI

protocole de cohérence de caches utilisé dans les multi-cœurs

MESIF

protocole de cohérence de caches utilisé dans les multi--cœurs

SIMD (Single Instruction Multiple Data)

Instructions des processeurs effectuant la même opération sur plusieurs données consécutives contenues dans un registre ou une case mémoire

VPU (Vector Processing Unit)

Nom de l’unité de calcul SIMD dans les coprocesseurs Xeon Phi d’Intel

HAUT DE PAGE
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Glossaire

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - ESP2. -    -  https://en.wikipedia.org/wiki/ESP32.

  • (2) - MATTSON (T.) -   The future of Many Core Computing : A tale of two processors,  -  https://cseweb.ucsd.edu/classes/fa12/cse291-c/talks/SCC-80-core-cern.pdf

  • (3) - DONGARRA (J.) -   Report on the Sunway TaihuLight System.  -  http://www.netlib.org/utk/people/JackDongarra/PAPERS/sunway-report-2016.pdf

  • (4) - FU (H.), LI AO (J.), YANG (J.), WANG (L.), HUANG (X.), YANG (C.), XUE (W.)i, QIAO (F.), ZHAO (W.), YIN (X.), HOU (C.), GE (W.), ZHANG (J.), WANG (Y.), YANG (G.) -   The Sunway TaihuLight supercomputer : system and applications  -  In SCIENCE CHINA, Information Sciences, 59, 072001(2016). doi:10.1007/s11432-016-5588-7

  • (5) - INTEL WHITE PAPER -   Migrating Offloading Software to Intel® Xeon Phi™ Processor,  -  February 2018. https://www.intel.com/content/dam/www/public/us/en/documents/white-papers/migrating-offloading-software-paper.pdf

  • ...

ANNEXES

  1. 1 Sites web
    Logo Techniques de l'Ingenieur

    Cet article est réservé aux abonnés.
    Il vous reste 93 % à découvrir.

    Pour explorer cet article Consulter l'extrait gratuit

    Déjà abonné ?


    Article inclus dans l'offre

    "Technologies logicielles Architectures des systèmes"

    (236 articles)

    Une base complète d’articles

    Actualisée et enrichie d’articles validés par nos comités scientifiques.

    Des contenus enrichis

    Quiz, médias, tableaux, formules, vidéos, etc.

    Des modules pratiques

    Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

    Des avantages inclus

    Un ensemble de services exclusifs en complément des ressources.

    Voir l'offre

    Ressources documentaires

    Architecture des ordinateurs : CPU et coprocesseurs/accélérateurs

    Les différents coprocesseurs/accélérateurs utilisés pour accélérer l'exécution des programmes dans ...

    Codage des nombres dans les ordinateurs

    Les processeurs ne travaillant que sur des chiffres binaires, un codage est nécessaire pour représenter ...

    Hiérarchie mémoire : les caches

    Entre le ou les processeurs d'un ordinateur et les organes de stockage existe une hiérarchie de ...

    Processeurs : exécution pipeline des instructions

    Cet article présente les caractéristiques essentielles de l'exécution pipeline des instructions dans les ...