Présentation

Article interactif

1 - DES PROCESSEURS MULTICŒURS AUX MANYCORES

2 - NOMBRE DE CŒURS

3 - CARACTÉRISTIQUES DES MANYCORES

4 - MANYCORES ORIENTÉS APPLICATIONS MOBILES ET EMBARQUÉES

5 - MANYCORES ORIENTÉS CALCUL SCIENTIFIQUE

6 - MANYCORES ORIENTÉS RÉSEAUX DE NEURONES PROFONDS

7 - REMARQUES POUR CONCLURE

Article de référence | Réf : H1014 v2

Nombre de cœurs
Processeurs à grand nombre de cœurs (manycores)

Auteur(s) : Daniel ETIEMBLE

Date de publication : 10 nov. 2023

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

RÉSUMÉ

Cet article présente les processeurs à très grand nombre de cœurs (manycores), avec les caractéristiques qui les distinguent des multicœurs et des GPU : type et performances des cœurs, décomposition hiérarchique en clusters de cœurs, modèle mémoire (partagée ou distribuée) et développements logiciels. Ils sont utilisés dans trois classes d’applications : les applications mobiles ou embarquées haute performance à faible consommation, le calcul scientifique haute performance et les accélérateurs pour réseaux de neurones profonds

Six exemples sont détaillés : les Xeon Phi d’Intel, le SW26010 utilisé dans le superordinateur TaihuLight, les versions 16, 64 et 1024 cœurs de l’architecture Epiphany d’Adapteva, lesmanycoresMMPA2 et MMPA3 de Kalray, l’accélérateur Boqueria  d’Untether et le circuit WSE-2 de Celebras

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

ABSTRACT

Manycore processors

This article introduces the manycore processors with the features that distinguish them from multi-cores and GPUs: type and performance of cores, hierarchical decomposition into clusters of cores, memory model (shared or distributed) and software developments. They are used in three classes of applications: high-performance computing for which performance is the key criterion, high-performance low-power mobile or embedded applications and large Deep Neural Networks

Six examples are detailed: the Intel Xeon Phi, the SW26010 used in the TaihuLight supercomputer, the 16, 64 and 1024 core versions of the Adapteva Epiphany architecture, the Kalray MMPA2 and MMPA3 processors, the Untether Boqueria AI accelerator and the Celebras WSE-2 wafer-scale circuit.

Auteur(s)

  • Daniel ETIEMBLE : Ingénieur de l’INSA de Lyon - Professeur émérite à l’université Paris Sud

INTRODUCTION

Sans prendre en compte les processeurs graphiques (GPU) qui constituent à eux-seuls une classe d’architecture, les processeurs à grand nombre de cœurs se distinguent des processeurs multicœurs, non seulement par le nombre de cœurs, mais également par un certain nombre de caractéristiques : le type et la performance des cœurs, la décomposition hiérarchique en clusters (ou nœuds) de cœurs, le modèle mémoire (mémoire partagée ou mémoire distribuée) et les problèmes logiciels liés au fait qu’ils sont presque toujours utilisés comme coprocesseurs. Ces manycores sont utilisés dans trois grandes classes d’applications :

  1. les applications mobiles et embarquées haute performance pour lesquelles les contraintes énergétiques sont fondamentales ;

  2. les applications pour lesquelles la haute performance est le critère le plus important, comme le calcul scientifique ;

  3. les circuits spécialisés pour l’apprentissage et l’inférence dans les réseaux de neurones profonds. Cette classe d’applications est celle qui voit apparaître le plus grand nombre de circuits.

Les différentes caractéristiques sont présentées avec les différentes variantes. Puis six exemples de processeurs manycores sont détaillés.

Les deux premiers sont des architectures destinées aux applications mobiles et embarquées haute performance et dissipent de quelques watts à trois dizaines de watts :

  • les processeurs implantant l’architecture Epiphany d’Adapteva, avec deux versions utilisées à 16 ou 64 cœurs et une version 1024 cœurs qui a été un échec ;

  • l’architecture MPPA de Kalray, avec notamment l’étude des versions MMPA2 et MPPA3.

Les deux exemples suivant sont destinés au calcul haute performance et dissipent deux à trois centaines de watts :

  • les processeurs et coprocesseurs Xeon Phi d’Intel avec les modèles Knights Corner et Knights Landing. Leur production a été abandonnée en 2018 ;

  • le manycore SW26010 utilisé dans le superordinateur chinois TaihuLight qui a été de juin 2016 à novembre 2017 le premier au TOP500 des superordinateurs.

Les deux derniers exemples correspondent à l’accélération de l’apprentissage et de l’inférence dans les réseaux de neurones :

  • l’accélérateur Boqueria AI de Untether est constitué d’une grille 2D de blocs mémoire, eux-même constitués d’une grille 2D de blocs avec un processeur élémentaire et une mémoire SRAM ;

  • le circuit WSE-2 de Celebras interconnecte une grille 2D de cœurs au niveau du wafer. Chaque cœur contient une partie calcul et une SRAM. Avec 850 000 cœurs et 15 kW de puissance dissipée, c’est le plus gros circuit en 2022.

Les processeurs manycores ne sont pas la continuité des multicœurs avec un plus grand nombre de cœurs. Le nombre de cœurs est très loin d’une progression exponentielle. Alors que les multicœurs utilisent le modèle mémoire partagée avec une hiérarchie de caches, les manycores utilisent le modèle mémoire distribuée, avec des blocs mémoire près du calcul. L’utilisation pour les réseaux de neurones de formats de donnée réduits (flottants 16 bits et 8 bits) permet d’augmenter le nombre de cœurs à consommation et surface de puce données par rapport aux circuits avec flottants double précision.

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

KEYWORDS

manycore   |   Xeon Phi   |   SW26010   |   Epiphany   |   Kalray   |   Untether   |   Celebras

VERSIONS

Il existe d'autres versions de cet article :

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v2-h1014


Cet article fait partie de l’offre

Technologies logicielles Architectures des systèmes

(233 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

2. Nombre de cœurs

On peut penser que le grand nombre de cœurs est ce qui caractérise en premier lieu les architectures manycores. En fait, la structure et la complexité des cœurs doivent être prises en compte.

Les processeurs graphiques (GPU) ont un grand nombre de cœurs, beaucoup plus que les multicœurs, à l’exception du circuit Celebras présenté au § 6.2.

Par exemple, le GPU Titan V de NVidia a 5120 cœurs CUDA et 640 cœurs tenseurs.

Si les GPU sont parfois considérés comme des manycores, ceci est très discutable. En effet, les cœurs des GPU sont le résultat de l’évolution des processeurs graphiques depuis qu’ils sont devenus totalement programmables (voir [H 1 013]). Les cœurs des GPU sont simples, conçus pour un parallélisme massif. Les cœurs des GPU ont un grand débit d’exécution, avec des latences importantes. Au contraire, les cœurs des CPU sont conçus pour des applications complexes, avec une logique de contrôle importante, un nombre réduit d’opérateurs de calcul, une hiérarchie de caches et des latences faibles. Les processeurs graphiques (GPU) sont donc une classe d’architecture à part entière, que nous ne considérons pas comme relevant de la problématique manycore. Le lecteur peut ne pas partager notre point de vue. Dans ce cas, il est invité à consulter l’article ...

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

TEST DE VALIDATION ET CERTIFICATION CerT.I. :

Cet article vous permet de préparer une certification CerT.I.

Le test de validation des connaissances pour obtenir cette certification de Techniques de l’Ingénieur est disponible dans le module CerT.I.

Obtenez CerT.I., la certification
de Techniques de l’Ingénieur !
Acheter le module

Cet article fait partie de l’offre

Technologies logicielles Architectures des systèmes

(233 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Nombre de cœurs
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - MATTSON (T.) -   The future of Many Core Computing: A tale of two processors,  -  https://cseweb.ucsd.edu/classes/fa12/cse291-c/talks/SCC-80-core-cern.pdf

  • (2) - DONGARRA (J.) -   Report on the Sunway TaihuLigtht System.  -  http://www.netlib.org/utk/people/JackDongarra/PAPERS/sunway-report-2016.pdf

  • (3) - FU (H.), LI AO (J.), YANG (J.), WANG (L.), HUANG (X.), YANG (C.), XUE (W.), QIAO (F.), ZHAO (W.), YIN (X.), HOU (C.), GE (W.), ZHANG (J.), WANG (Y.), YANG (G.) -   The Sunway TaihuLight supercomputer: system and applications,  -  In SCIENCE CHINA, Information Sciences, 59, 072001 (2016); doi : 10.1007/s11432-016-5588-7.

  • (4) - ADAPTEVA -   Epiphany Architecture Reference,  -  Rev 14.03.11, 2014. Available: http://adapteva.com/docs/epiphany_arch_ref.pdf, [Nov. 25, 2014].

  • (5) - OLOFSSON (A.), NORDSTROM (T.), UL-ABDIN (UL-ABDIN) (Z.) -   Kickstarting High-performance Energy-efficient Manycore Architectures with Epiphany,  -  Proceedings Asilomar Conference on Signal, Systems and Computers, pp 1719-1726 (2014).

  • ...

ANNEXES

  1. 1 Sites Web

    Cet article est réservé aux abonnés.
    Il vous reste 94% à découvrir.

    Pour explorer cet article
    Téléchargez l'extrait gratuit

    Vous êtes déjà abonné ?Connectez-vous !


    L'expertise technique et scientifique de référence

    La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
    + de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
    De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

    Cet article fait partie de l’offre

    Technologies logicielles Architectures des systèmes

    (233 articles en ce moment)

    Cette offre vous donne accès à :

    Une base complète d’articles

    Actualisée et enrichie d’articles validés par nos comités scientifiques

    Des services

    Un ensemble d'outils exclusifs en complément des ressources

    Un Parcours Pratique

    Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

    Doc & Quiz

    Des articles interactifs avec des quiz, pour une lecture constructive

    ABONNEZ-VOUS

    Sommaire

    QUIZ ET TEST DE VALIDATION PRÉSENTS DANS CET ARTICLE

    1/ Quiz d'entraînement

    Entraînez vous autant que vous le voulez avec les quiz d'entraînement.

    2/ Test de validation

    Lorsque vous êtes prêt, vous passez le test de validation. Vous avez deux passages possibles dans un laps de temps de 30 jours.

    Entre les deux essais, vous pouvez consulter l’article et réutiliser les quiz d'entraînement pour progresser. L’attestation vous est délivrée pour un score minimum de 70 %.


    L'expertise technique et scientifique de référence

    La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
    + de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
    De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

    Cet article fait partie de l’offre

    Technologies logicielles Architectures des systèmes

    (233 articles en ce moment)

    Cette offre vous donne accès à :

    Une base complète d’articles

    Actualisée et enrichie d’articles validés par nos comités scientifiques

    Des services

    Un ensemble d'outils exclusifs en complément des ressources

    Un Parcours Pratique

    Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

    Doc & Quiz

    Des articles interactifs avec des quiz, pour une lecture constructive

    ABONNEZ-VOUS