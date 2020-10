Afin de rendre plus accessible et intuitif l’accès aux solutions de calcul intensif, le CEA a déployé une interface de type cloud. En s’appuyant sur des briques open source, le CEA entend également favoriser les échanges entre les centres de cinq pays européens.

Le cloud est devenu une norme. Pour les entreprises, mais aussi pour les scientifiques. En complément des ressources de calcul intensif déjà installées, le CEA a mis en place dans son TGCC (Très Grand Centre de calcul du CEA) de nouveaux systèmes de calcul et de stockage. Ces systèmes offrent aux chercheurs de nouveaux services de « cloud computing ».

Le TGCC est l’une des principales installations européennes de calcul intensif, et est opéré par les équipes de la Direction des applications militaires du CEA (DAM).

Conçue par la société Atos/Bull, « cette infrastructure de type cloud permet le développement de services par les chercheurs eux-mêmes pour des communautés de chercheurs, tels que des services web, des bases de données partagées ou des plateformes d’open-data », explique le CEA dans un communiqué.

« Ce projet, qui concerne des centres de calcul européens de cinq pays (1), a pour but d’offrir aux scientifiques une interface de type cloud afin d’améliorer l’ergonomie des services. L’objectif n’est pas de faire du ‘high performance computing’ (ou HPC) dans le cloud, mais de faire du cloud dans le HPC. Par ailleurs, il était important que notre infrastructure cloud soit la plus proche des super calculateurs et de leur stockage », précise Jacques-Charles Lafoucrière, program manager au CEA.

Une communauté open source

Cette infrastructure s’appuie sur deux « briques » open source. Premièrement, la suite de logiciels libres OpenStack qui permet de faire tourner jusqu’à 600 serveurs virtuels. Deuxièmement, le logiciel libre de stockage OpenIO (développé par la start-up du même nom et qui a été racheté cet été par OVH Cloud) gère le système de « stockage objet » d’une capacité de 7 Pétaoctets.

Appelée aussi « object storage », cette solution est la méthode de stockage de données la plus utilisée sur le cloud. Elle permet un accès plus rapide aux données qui sont sécurisées en tant que « objets » (pas une hiérarchie de répertoires comme dans le stockage classique). On peut se représenter un « objet » comme un paquet. Ce dernier contient les données elles-mêmes, ainsi que de nombreuses métadonnées et un identifiant (ID) unique.

« Il y a une démarche européenne à encourager les centres de calcul à s’appuyer sur des solutions open source. Premièrement, elle répond à cette volonté de faire bénéficier tous les acteurs des financements européens et, deuxièmement, elle encourage ‘les effets de levier’ ; on développe des logiciels et on en fait bénéficier les autres centres de calcul pour qu’ils deviennent, à leur tour, des contributeurs pour résoudre des problèmes », commente Jacques-Charles Lafoucrière.

Le TGCC bénéfice également d’un cluster de calcul interactif, optimisé pour la visualisation, le post-traitement, les travaux interactifs et l’intelligence artificielle. « Ce cluster, qui est équipé de la dernière génération de processeurs Intel, et d’unités de traitement graphique haute-performance de Nvidia, propose jusqu’à 3 Téraoctets de mémoire par serveur », précise le CEA.

Particulièrement adapté à la simulation de grands réseaux de neurones, il permet notamment aux chercheurs d’interagir avec leurs simulations, une pratique nommée « calcul interactif ».

« Avec le calcul intensif, l’usage classique sur ce type de machines est de la soumission de travaux (batch) : vous soumettez un travail et au bout de plusieurs semaines, voire des mois, vous obtenez le résultat. Avec le calcul interactif, appelé également ‘urgent computing‘ ou ‘calcul à la demande‘, vous pouvez être plus réactif. Par exemple, si vous êtes en train de travailler sur une simulation du cerveau et qu’à un instant donné, vous avez besoin de réaliser un traitement ponctuel, vous pouvez profiter de la puissance de calcul d’un supercalculateur », explique Jacques-Charles Lafoucrière.

Pour l’instant, le CEA réalise des tests de son approche cloud. Ils concernent la migration vers cette nouvelle infrastructure d’une base de données d’un ensemble de services qui est aujourd’hui hébergé par le CATI (Centre d’acquisition et de traitement des images), à Saclay. « Lorsque sa migration sera terminée, elle bénéficiera d’un espace de stockage plus important et d’une meilleure visibilité auprès de toute la communauté scientifique européenne », explique Jacques-Charles Lafoucrière.

À terme, cette extension du centre de calcul TGCC aidera notamment les chercheurs à cartographier et simuler tout ou partie d’un cerveau humain, mais aussi à tester des intelligences artificielles de robots ou véhicules autonomes dans des environnements virtuels.

(1) L’infrastructure informatique de calcul interactif (Interactive Computing e-Infrastructure, ICEI) est mise en œuvre pour le projet Human Brain (HBP) par les principaux centres de calcul européens, à savoir BSC (Espagne), le CEA (France), CINECA (Italie), CSCS (Suisse), et JSC (Allemagne), afin de former la fédération de services Fenix.