Interview

SmartDigiCat : catalyse, sciences des données et IA… L’union fait la force

Posté le 5 octobre 2022
par Benoît CRÉPIN
dans Innovations sectorielles

Le 31 août dernier a eu lieu, à Centrale Lille, le lancement officiel d’une nouvelle chaire dite « industrielle », baptisée SmartDigiCat. Réunissant acteurs de l’industrie et du monde académique, le projet a pour ambition principale d’unir catalyse, science des données et intelligence artificielle dans un but en particulier : développer des procédés catalytiques plus sûrs et plus respectueux de l’environnement.

La chaire SmartDigicat – pour catalyse digitale intelligente – est portée par l’équipe VAALBIO (Valorisation des alcanes et de la biomasse) de l’UCCS (Unité de Catalyse et Chimie du Solide – UMR CNRS 8181) en partenariat avec le Centre de recherche en informatique, signal et automatique de Lille CRIStAL (UMR CNRS 9189), Inria et les sociétés Solvay, Horiba et Teamcat Solutions.

Financée notamment par la Métropole européenne de Lille et l’Initiative d’excellence Université de Lille, elle a pour but de promouvoir l’innovation ainsi que les partenariats public-privé noués autour d’un défi scientifique et technique : la catalyse digitale. Une approche particulièrement prometteuse pour la recherche, la formation et le développement économique du territoire.

Elle vise en effet à développer des procédés catalytiques plus sûrs et plus respectueux de l’environnement, en combinant plusieurs aspects : le criblage haut débit, destiné à accélérer l’acquisition des données expérimentales, la chimie théorique, vouée à améliorer les prédictions des performances des catalyseurs, l’intelligence artificielle, qui va permettre de réduire le temps d’analyse de la masse de données à traiter, ainsi que les sciences humaines, vouées quant à elles à mesurer les impacts sociétaux des procédés développés.

Ces nouveaux procédés se destinent ainsi à des domaines variés tels que ceux des matériaux, de la chimie et de la formulation chimique, pour des applications possibles en santé, alimentation, bioéconomie ou encore énergie. C’est ce que nous explique en détail Sébastien Paul, professeur à Centrale Lille, responsable de l’équipe VAALBIO à l’UCCS, mais aussi porteur de cette chaire industrielle SmartDigiCat qui vient d’être mise sur les rails.

Techniques de l’Ingénieur : Commençons, si vous le voulez bien, par quelques définitions… Tout d’abord, qu’est-ce qu’une chaire industrielle ?

Sébastien Paul, professeur à Centrale Lille, responsable de l’équipe VAALBIO à l’UCCS et porteur de la chaire industrielle SmartDigiCat. ©Centrale Lille

Sébastien Paul : C’est une bonne question, car il existe effectivement plusieurs définitions en fonction de la perception que l’on a de ce concept. Une chaire industrielle, pour moi, est un consortium d’académiques et d’industriels qui se rassemblent autour d’une thématique d’intérêt, qu’ils vont alors s’atteler à développer ensemble. Cela inclut la recherche, mais aussi un volet formation. Bien entendu, le financement est lui aussi commun. Il est réalisé par des investisseurs publics et privés. Ici, pour SmartDigiCat, c’est la Métropole européenne de Lille et l’Université de Lille qui co-financent pour la partie publique.

Le nom de cette chaire associe la catalyse à deux autres mots clés : smart et digital. Pouvez-vous définir chacun de ces termes ?

L’acronyme vient en effet de l’idée d’associer l’aspect sciences des données – smart et digital – avec la chimie – la catalyse. Le catalyseur est une entité chimique ou biologique qui accélère une réaction, sans pour autant être consommé au cours de cette réaction. Le « SmartDigi » dans l’acronyme du nom du projet est là, quant à lui, pour signifier que l’on va mettre en œuvre des méthodes issues de l’intelligence artificielle, de la science des données, ce qui est un peu une révolution dans le domaine. On ne combinait en effet généralement pas les deux secteurs.

Comment l’idée de créer cette chaire est-elle née ?

C’est quelque chose qui s’est construit progressivement. Il y a à peu près 10 ans, nous imaginions une plate-forme robotisée, parallélisée, qui allait nous permettre d’accélérer très fortement l’acquisition des données expérimentales ; un aspect qui reste vraiment très important dans notre secteur de recherche. Nous avons pour cela eu la chance de recevoir un important financement dans le cadre du Programme d’investissement d’avenir pour cet « Equipex[1] » baptisé REALCAT. Cela a représenté 9 millions d’euros d’investissement, c’était vraiment un très très gros projet. La plate-forme est complètement opérationnelle depuis 2015. Tous ces robots génèrent donc maintenant des données expérimentales qui nous prenaient au moins dix voire cent fois plus de temps à acquérir auparavant. Nous pouvons donc désormais aller très vite sur l’acquisition de ces données. Ce qui est devenu limitant, en revanche, dans le process, est donc l’analyse, le traitement de ces données. Nous nous attachons en effet à comparer les performances de ces catalyseurs avec leurs propriétés. Nous essayons de dresser une sorte de carte d’identité des catalyseurs à partir de multiples analyses, chimiques ou biologiques. Le travail des chercheurs consiste ensuite à comprendre comment on relie les deux jeux de données : la partie entrée et la partie sortie. C’est là notamment que l’IA peut nous aider à accélérer ce processus. Aujourd’hui, une semaine d’acquisition de données sur la plate-forme REALCAT implique environ trois semaines de travail d’analyse des données avec les outils actuels.

Quels gains de temps espérez-vous obtenir grâce à l’IA ? Quels sont les intérêts de cette accélération ?

Je pense que l’on pourrait quasiment atteindre du temps réel. Dans un volet du projet SmartDigiCat, on trouve l’objectif d’optimiser le fonctionnement d’un réacteur catalytique chimique. Il s’agit justement dans ce cas d’analyser presque en temps réel les données de sortie de ce réacteur, et en fonction de ce qui sort, de réajuster les paramètres d’entrée du réacteur en temps réel. Ceci permettrait d’éviter la production de déchets, mais aussi d’entrer dans des conditions qui remettraient en cause la sécurité du procédé. Tout cela en temps réel grâce à une analyse immédiate des données, traitées par des algorithmes d’IA. Aujourd’hui cela n’est pas fait : seule une analyse humaine permet de traiter ces données. S’il fonctionne, ce concept pourrait à terme être extrapolé à l’échelle industrielle.

Qui sont les différents partenaires, académiques et industriels, de cette chaire SmartDigiCat ?

J’entretiens notamment une collaboration très ancienne avec la société Solvay, qui a créé avec le CNRS un laboratoire commun basé à Shanghai. Ce laboratoire s’appelle E2P2L et il est spécialisé dans le développement de procédés éco-conçus, basés sur le renouvelable, la biomasse notamment. La plupart de leurs procédés sont catalytiques. Nous avons donc plus d’une dizaine d’années de collaboration. J’ai eu l’occasion de les rencontrer souvent, et un sujet se révélait très important pour Solvay : la digitalisation. Le partenariat avec Solvay est donc né de l’idée de coconstruire un projet autour de la digitalisation. Progressivement, d’autres acteurs sont venus se greffer sur le projet, à commencer par Horiba. Cette société possède un important centre de R&D qui vient d’être installé dans la région lilloise. Elle est experte sur des aspects tels que la métrologie et l’instrumentation permettant d’analyser les produits chimiques, dont les catalyseurs. Le troisième et dernier acteur industriel de ce consortium est Teamcat Solutions, une toute petite entreprise que j’ai cofondée avec trois associés il y a sept ans et qui se consacre à l’instrumentation pour le criblage catalytique, donc à la partie acquisition des données expérimentales, et ce en haut débit.

Nous avons également quatre partenaires académiques, qui s’ajoutent ainsi à ces trois premiers partenaires industriels. Le premier d’entre eux est l’Unité de catalyse et chimie du solide[2], le laboratoire dans lequel j’exerce. Notre expertise concerne la catalyse et la chimie verte, pour faire simple. Notre contribution va être importante, car les catalyseurs sont au centre des procédés… Ces catalyseurs, il faut les analyser, les caractériser, comme je l’évoquais. Un autre partenaire académique va donc intervenir sur ce plan : l’Institut Michel-Eugène Chevreul. Il s’agit d’une Fédération de recherche CNRS[3] qui pilote des plates-formes. Toutes ces plates-formes vont être mises à contribution pour le projet. L’UCCS fait d’ailleurs elle-même partie de cette Fédération de recherche… Les deux derniers partenaires académiques sont ceux qui apporteront leur expertise sur les aspects sciences des données et IA. Il s’agit du laboratoire CRIStAL[4] d’une part, et d’autre part d’Inria[5], reconnu pour ses recherches dans le domaine du numérique et qui dispose d’un site lillois. Les chercheurs de ces deux entités sont associés dans les différents lots de la chaire, à toutes les étapes : de la préparation du catalyseur jusqu’à sa caractérisation et sa mise en œuvre dans les réacteurs.

Que sont ces « lots » que vous évoquez ?

Le projet a été construit de manière à suivre les étapes de développement d’un catalyseur. On va donc avoir d’abord le choix du catalyseur, sa sélection. Il existe en effet de très nombreuses familles de catalyseurs. Aujourd’hui, la plupart du temps, le choix est basé sur les connaissances issues de la littérature et de l’expertise du chercheur. Dans cette étape de sélection, la chimie théorique devient de plus en plus précise, elle permet de véritables prédictions. Elle évite ainsi de réaliser des expériences pour rien en nous indiquant le chemin à suivre. On utilise donc cette chimie théorique comme outil d’aide à la décision. Cela est quelque chose de relativement nouveau, et qui s’est fortement développé ces cinq dernières années : aller jusqu’à la prédiction fiable demande des temps de calcul très longs. L’IA va permettre de ne pas faire tous ces calculs, réduisant ainsi considérablement le temps nécessaire pour obtenir ces prédictions. C’est tout ce volet que nous allons développer dans le premier lot scientifique de la chaire. Cela va notamment bénéficier à Solvay, en permettant d’améliorer le procédé de production d’eau oxygénée, qui représente un très gros enjeu pour l’entreprise. Nous allons tenter d’améliorer le catalyseur utilisé aujourd’hui industriellement. Cela pourrait avoir un impact très important sur les performances du process.

Le deuxième lot porte quant à lui plutôt sur la caractérisation, l’analyse des catalyseurs. L’enjeu principal va consister à améliorer l’analyse de ces catalyseurs par microscopie et par spectrométrie Raman. Nous voulons développer un réacteur équipé d’une sonde Raman, dans lequel se déroulera la réaction de synthèse du catalyseur. En fonction des signaux mesurés par la sonde, nous allons modifier les paramètres de température, de concentration des réactifs, afin d’agir en temps réel sur ce qui se produit dans le réacteur. La partie microscopie va quant à elle s’attacher à comprendre comment la science des données peut nous aider à traiter la masse d’informations qui vient de la microscopie collaborative. Horiba a en effet développé un « nano-GPS », qui permet de pouvoir scruter toujours la même zone d’un échantillon, même en passant d’un microscope à un autre. L’idée est donc de pouvoir compiler les différentes informations provenant des différentes analyses, ce qui génère beaucoup de données, notamment des images. Le traitement de ces images va donc être amélioré, accéléré grâce à l’IA.

Le lot 3 concerne la mise en œuvre des catalyseurs. Il s’agit là de la boucle de rétroaction entre l’entrée et la sortie du réacteur. Teamcat solutions va être l’acteur le plus impliqué sur ce volet. L’entreprise a en effet développé un système multiréacteurs qui permet d’effectuer une acquisition sur quatre réacteurs en parallèle. Cela permet donc d’accélérer le processus et de générer plus de données pour nourrir les algorithmes.

Enfin, deux autres lots s’ajoutent à ces trois premiers : le quatrième porte sur l’élargissement des champs d’application, alors que le cinquième est axé sur l’analyse sociologique de l’usage de l’IA dans le secteur de la chimie.

Cette association entre chimie, IA et sociologie est plutôt surprenante… Pourquoi avoir inclus cette discipline des sciences sociales dans ce programme scientifique ?

Il était important pour moi de ne pas associer uniquement les sciences « dures » dans le projet, mais d’avoir également un regard du côté sciences humaines et sociales. Dans le cadre du label Initiative d’excellence française « I-SITE » dont bénéficie l’Université de Lille, nous avons la chance d’avoir dans mon équipe une philosophe des sciences, Michèle Friend, qui développe un outil qui s’appelle la boussole institutionnelle. Il est difficile d’expliquer cela en deux mots, mais, très simplement, il s’agit d’un outil d’aide à la décision qui permet de voir dans quelle direction on va en fonction de choix qui ne sont pas uniquement économiques, mais aussi environnementaux et sociétaux. Cela peut s’appliquer à tout type de système et permet par exemple de comparer des procédés chimiques, bio- ou pétro-sourcés. L’idée est donc d’utiliser l’outil pour comprendre comment la société, monsieur ou madame Tout-le-monde, va percevoir le fait d’associer les développements en chimie avec de l’IA. L’image de la chimie pour le grand public n’est en effet, malheureusement, pas toujours très positive, alors qu’elle rend d’immenses services au quotidien, sans que l’on s’en rende compte. Au contraire, on ne la met en avant que pour les risques d’accident, de pollution… Le fait d’ajouter à cela de l’IA, qui peut elle aussi faire peur, implique donc d’étudier la façon dont tout cela est perçu.

Je pense qu’il est important de combiner les expertises des chercheurs en sciences dures et en sciences humaines, afin de faire les bons choix, d’aller dans les bonnes directions. On peut être persuadé, en tant que chercheurs en chimie et en sciences des données, que l’association chimie-IA va être porteuse et va amener très rapidement à des découvertes très intéressantes… Mais si, derrière, il existe une mauvaise acceptation de la part du public, pas sûr que les industriels franchissent le pas et utilisent ces méthodes. Il est donc important d’étudier tout cela en amont.

En matière de calendrier, quels sont les grands jalons qui vont marquer ce projet de chaire industrielle ?

En fait, la chaire a déjà démarré depuis un an environ. Un certain nombre de travaux sont déjà lancés sur les différents lots. Après le lancement officiel de la chaire le 31 août dernier, le prochain évènement marquant sera un premier workshop, qui sera sans doute organisé au 2e trimestre de 2023, très probablement sur le thème de l’hydrogène vert. À la même époque, mais en 2024, un autre workshop aura lieu, mais son thème n’est pas encore défini. Entretemps, fin 2023, on aura un creative lab, un évènement un peu particulier. Les workshops vont en effet associer les professionnels de la chimie et du numérique, alors que ce creative lab sera plutôt un évènement centré sur l’innovation, associant en plus les étudiants aux professionnels, aux chercheurs. L’objectif est de phosphorer ensemble pour donner naissance à des innovations.

La clôture de cette chaire est prévue pour 2024. Qu’adviendra-t-il après cette date butoir ?

L’idée de base, avec cette chaire, est de lancer des travaux communs entre les experts du numérique et de la chimie, de manière à asseoir sur le site lillois une expertise reconnue sur la catalyse digitale. Si l’on atteint cet objectif, cela devrait déboucher sur de nouveaux développements, de nouveaux partenariats, avec les industriels partenaires ou d’autres… L’idée n’est pas de lancer un projet de trois ans, puis de le stopper brusquement. Nous voulons développer une expertise qui puisse être pérenne et faire de ce projet une véritable rampe de lancement.

Donné le 31 août dernier à Centrale Lille, le coup d’envoi officiel de cette chaire industrielle a été l’occasion pour Sébastien Paul de présenter les retombées attendues du projet. ©Centrale Lille

Lors du kick-off de cette chaire, vous avez souligné à plusieurs reprises l’importance de la formation. Pour quelles raisons ?

Il est effectivement très important de ne pas voir que le côté recherche de la chaire. J’ambitionne également de passer un message aux étudiants, notamment des masters de l’Université, en leur expliquant ce qu’est l’approche SmartDigiCat. Cela sera également important pour les étudiants des écoles d’ingénieur comme Centrale Lille. J’ai à cœur de sensibiliser les jeunes qui seront les chercheurs ou les ingénieurs de demain sur ce qui est en train de se produire dans le secteur où ils exerceront bientôt.

Cela pourrait-il également avoir un impact en matière d’emploi… ?

Bien sûr, à commencer par les perspectives d’embauche chez les partenaires industriels de la chaire. Les jeunes chercheurs formés à l’interface entre chimie et numérique sont en effet extrêmement recherchés actuellement sur le marché de l’emploi. La plupart des post-doctorants seront ainsi par exemple embauchés par les entreprises avant même la fin de leur stage post-doctoral. Les thèses pourront être financées ou cofinancées par les partenaires industriels. Nous allons ainsi recruter dans le cadre de cette chaire SmartDigiCat quatre doctorants, trois post-doctorants, deux ingénieurs et cinq masters. La création de la chaire a d’ailleurs permis de lever d’autres financements par effets leviers. Cela va notamment permettre d’embaucher ces jeunes chercheurs, de les former. Ils seront tous co-encadrés par des acteurs académiques et industriels, de manière à leur permettre de comprendre les contraintes des industriels dans le développement de la recherche académique. De cette manière, on ne développe pas des recherches académiques hors-sol par rapport au monde réel. Cela existe, malheureusement, et on peut le faire sans même s’en rendre compte. En revanche, la recherche ne peut pas être uniquement dictée par le monde industriel. C’est donc en faisant se rencontrer ces deux mondes que l’on peut faire avancer les choses. Les recherches fondamentale et appliquée se nourrissent, il ne faut pas les opposer. Tous les jeunes ainsi co-encadrés seront, j’en suis persuadé, très recherchés sur le marché du travail.


[1] Equipex : équipement d’excellence. Il s’agit de projets financés par le Programme d’investissement d’avenir (PIA) et destinés à améliorer les équipements des laboratoires de recherche scientifique français.

[2] Unité de Catalyse et Chimie du Solide : UCCS – UMR CNRS 818

[3] FR2638

[4] UMR CNRS 9189

[5] Institut national de recherche en sciences et technologies du numérique


Pour aller plus loin