Des processeurs multicœurs aux manycores
Processeurs à grand nombre de cœurs (manycores)
H1014 v2 Article de référence

Des processeurs multicœurs aux manycores
Processeurs à grand nombre de cœurs (manycores)

Auteur(s) : Daniel ETIEMBLE

Date de publication : 10 nov. 2023

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Des processeurs multicœurs aux manycores

2 - Nombre de cœurs

3 - Caractéristiques des manycores

4 - Manycores orientés applications mobiles et embarquées

5 - Manycores orientés calcul scientifique

6 - Manycores orientés réseaux de neurones profonds

7 - Remarques pour conclure

Sommaire

Présentation

RÉSUMÉ

Cet article présente les processeurs à très grand nombre de cœurs (manycores), avec les caractéristiques qui les distinguent des multicœurs et des GPU : type et performances des cœurs, décomposition hiérarchique en clusters de cœurs, modèle mémoire (partagée ou distribuée) et développements logiciels. Ils sont utilisés dans trois classes d’applications : les applications mobiles ou embarquées haute performance à faible consommation, le calcul scientifique haute performance et les accélérateurs pour réseaux de neurones profonds

Six exemples sont détaillés : les Xeon Phi d’Intel, le SW26010 utilisé dans le superordinateur TaihuLight, les versions 16, 64 et 1024 cœurs de l’architecture Epiphany d’Adapteva, lesmanycoresMMPA2 et MMPA3 de Kalray, l’accélérateur Boqueria  d’Untether et le circuit WSE-2 de Celebras

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Daniel ETIEMBLE : Ingénieur de l’INSA de Lyon - Professeur émérite à l’université Paris Sud

INTRODUCTION

Sans prendre en compte les processeurs graphiques (GPU) qui constituent à eux-seuls une classe d’architecture, les processeurs à grand nombre de cœurs se distinguent des processeurs multicœurs, non seulement par le nombre de cœurs, mais également par un certain nombre de caractéristiques : le type et la performance des cœurs, la décomposition hiérarchique en clusters (ou nœuds) de cœurs, le modèle mémoire (mémoire partagée ou mémoire distribuée) et les problèmes logiciels liés au fait qu’ils sont presque toujours utilisés comme coprocesseurs. Ces manycores sont utilisés dans trois grandes classes d’applications :

  1. les applications mobiles et embarquées haute performance pour lesquelles les contraintes énergétiques sont fondamentales ;

  2. les applications pour lesquelles la haute performance est le critère le plus important, comme le calcul scientifique ;

  3. les circuits spécialisés pour l’apprentissage et l’inférence dans les réseaux de neurones profonds. Cette classe d’applications est celle qui voit apparaître le plus grand nombre de circuits.

Les différentes caractéristiques sont présentées avec les différentes variantes. Puis six exemples de processeurs manycores sont détaillés.

Les deux premiers sont des architectures destinées aux applications mobiles et embarquées haute performance et dissipent de quelques watts à trois dizaines de watts :

  • les processeurs implantant l’architecture Epiphany d’Adapteva, avec deux versions utilisées à 16 ou 64 cœurs et une version 1024 cœurs qui a été un échec ;

  • l’architecture MPPA de Kalray, avec notamment l’étude des versions MMPA2 et MPPA3.

Les deux exemples suivant sont destinés au calcul haute performance et dissipent deux à trois centaines de watts :

  • les processeurs et coprocesseurs Xeon Phi d’Intel avec les modèles Knights Corner et Knights Landing. Leur production a été abandonnée en 2018 ;

  • le manycore SW26010 utilisé dans le superordinateur chinois TaihuLight qui a été de juin 2016 à novembre 2017 le premier au TOP500 des superordinateurs.

Les deux derniers exemples correspondent à l’accélération de l’apprentissage et de l’inférence dans les réseaux de neurones :

  • l’accélérateur Boqueria AI de Untether est constitué d’une grille 2D de blocs mémoire, eux-même constitués d’une grille 2D de blocs avec un processeur élémentaire et une mémoire SRAM ;

  • le circuit WSE-2 de Celebras interconnecte une grille 2D de cœurs au niveau du wafer. Chaque cœur contient une partie calcul et une SRAM. Avec 850 000 cœurs et 15 kW de puissance dissipée, c’est le plus gros circuit en 2022.

Les processeurs manycores ne sont pas la continuité des multicœurs avec un plus grand nombre de cœurs. Le nombre de cœurs est très loin d’une progression exponentielle. Alors que les multicœurs utilisent le modèle mémoire partagée avec une hiérarchie de caches, les manycores utilisent le modèle mémoire distribuée, avec des blocs mémoire près du calcul. L’utilisation pour les réseaux de neurones de formats de donnée réduits (flottants 16 bits et 8 bits) permet d’augmenter le nombre de cœurs à consommation et surface de puce données par rapport aux circuits avec flottants double précision.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


VERSIONS

Il existe d'autres versions de cet article :

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v2-h1014

Lecture en cours
Présentation

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

1. Des processeurs multicœurs aux manycores

Les processeurs multicœurs sont étudiés en détail dans l’article [H 1 090]. Depuis le premier bicœur en 2001 (Power4 d’IBM), ils se sont imposés comme la seule solution permettant de continuer à améliorer les performances tout en conservant une dissipation énergétique compatible avec les techniques classiques utilisées pour la mise en boîtier et le refroidissement. En 2023, la plupart des processeurs d’usage général (PC et serveurs) ou des systèmes mobiles (smartphones) sont des multicœurs. Seuls les systèmes à très faible consommation ou faibles performances utilisent encore des monoprocesseurs.

Les principaux fournisseurs de multicœurs sont Intel et AMD, IBM, ARM et Oracle (Sparc). Les cœurs utilisés sont des processeurs superscalaires performants (exécution non ordonnée). Le nombre maximal de cœurs physiques disponibles fin 2022 est respectivement 64 (AMD) et 40 (Intel) pour les serveurs haut de gamme. Pour les PC, la gamme Raptor Lake d’Intel utilise deux types de cœurs : des cœurs performants (P-core) avec 2 threads optimisés pour la performance et des cœurs efficaces (E-Core) monothread moins performants et consommant moins. Les processeurs Core i9 les plus performants utilisent 24 cœurs (8 P + 16 E). Pour AMD, les Ryzen 9 les plus performants ont 16 cœurs physiques. À l’exception des E-Core d’Intel, les cœurs ont 2 threads.

Un certain nombre de processeurs manycores ont été réalisés et évalués, en plusieurs étapes, avec des caractéristiques différentes. De manière non exhaustive, on peut citer :

  • des processeurs Intel conçus comme processeurs de recherche au niveau matériel et logiciel  : le processeur 80 cœurs de 2006 en CMOS 65 nm et le processeur SCC à 48 cœurs ;

  • les architectures...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


TEST DE VALIDATION ET CERTIFICATION CerT.I. :

Cet article vous permet de préparer une certification CerT.I.

Le test de validation des connaissances pour obtenir cette certification de Techniques de l’Ingénieur est disponible dans le module CerT.I.

Obtenez CerT.I., la certification
de Techniques de l’Ingénieur !
Acheter le module
Lecture en cours
Des processeurs multicœurs aux manycores

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - MATTSON (T.) -   The future of Many Core Computing: A tale of two processors,  -  https://cseweb.ucsd.edu/classes/fa12/cse291-c/talks/SCC-80-core-cern.pdf

  • (2) - DONGARRA (J.) -   Report on the Sunway TaihuLigtht System.  -  http://www.netlib.org/utk/people/JackDongarra/PAPERS/sunway-report-2016.pdf

  • (3) - FU (H.), LI AO (J.), YANG (J.), WANG (L.), HUANG (X.), YANG (C.), XUE (W.), QIAO (F.), ZHAO (W.), YIN (X.), HOU (C.), GE (W.), ZHANG (J.), WANG (Y.), YANG (G.) -   The Sunway TaihuLight supercomputer: system and applications,  -  In SCIENCE CHINA, Information Sciences, 59, 072001 (2016); doi : 10.1007/s11432-016-5588-7.

  • (4) - ADAPTEVA -   Epiphany Architecture Reference,  -  Rev 14.03.11, 2014. Available: http://adapteva.com/docs/epiphany_arch_ref.pdf, [Nov. 25, 2014].

  • (5) - OLOFSSON (A.), NORDSTROM (T.), UL-ABDIN (UL-ABDIN) (Z.) -   Kickstarting High-performance Energy-efficient Manycore Architectures with Epiphany,  -  Proceedings Asilomar Conference on Signal, Systems and Computers, pp 1719-1726 (2014).

  • ...

ANNEXES

  1. 1 Sites Web
    Logo Techniques de l'Ingenieur

    Cet article est réservé aux abonnés.
    Il vous reste 94 % à découvrir.

    Pour explorer cet article Consulter l'extrait gratuit

    Déjà abonné ?


    Article inclus dans l'offre

    "Technologies logicielles Architectures des systèmes"

    (236 articles)

    Une base complète d’articles

    Actualisée et enrichie d’articles validés par nos comités scientifiques.

    Des contenus enrichis

    Quiz, médias, tableaux, formules, vidéos, etc.

    Des modules pratiques

    Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

    Des avantages inclus

    Un ensemble de services exclusifs en complément des ressources.

    Voir l'offre

    Sommaire

    QUIZ ET TEST DE VALIDATION PRÉSENTS DANS CET ARTICLE

    1/ Quiz d'entraînement

    Entraînez vous autant que vous le voulez avec les quiz d'entraînement.

    2/ Test de validation

    Lorsque vous êtes prêt, vous passez le test de validation. Vous avez deux passages possibles dans un laps de temps de 30 jours.

    Entre les deux essais, vous pouvez consulter l’article et réutiliser les quiz d'entraînement pour progresser. L’attestation vous est délivrée pour un score minimum de 70 %.


    L'expertise technique et scientifique de référence

    La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
    + de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
    De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

    Article inclus dans l'offre

    "Technologies logicielles Architectures des systèmes"

    (236 articles)

    Une base complète d’articles

    Actualisée et enrichie d’articles validés par nos comités scientifiques.

    Des contenus enrichis

    Quiz, médias, tableaux, formules, vidéos, etc.

    Des modules pratiques

    Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

    Des avantages inclus

    Un ensemble de services exclusifs en complément des ressources.

    Voir l'offre

    Ressources documentaires

    Architecture des ordinateurs : CPU et coprocesseurs/accélérateurs

    Les différents coprocesseurs/accélérateurs utilisés pour accélérer l'exécution des programmes dans ...

    Codage des nombres dans les ordinateurs

    Les processeurs ne travaillant que sur des chiffres binaires, un codage est nécessaire pour représenter ...

    Hiérarchie mémoire : les caches

    Entre le ou les processeurs d'un ordinateur et les organes de stockage existe une hiérarchie de ...

    Processeurs : exécution pipeline des instructions

    Cet article présente les caractéristiques essentielles de l'exécution pipeline des instructions dans les ...