Conclusion et perspectives
Apprentissage statistique inspiré par la physique - Principes et application à la prévision d’énergie photovoltaïque

IN703 v1 RECHERCHE ET INNOVATION

Conclusion et perspectives
Apprentissage statistique inspiré par la physique - Principes et application à la prévision d’énergie photovoltaïque

Auteur(s) : Vincent LE GUEN

Date de publication : 10 déc. 2023 | Read in English

Cet article est réservé aux abonnés

Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?Se connecter

Sommaire
Médias

Présentation

1 - Différentes approches de modélisation

1.1 - Approches basées sur un modèle
1.2 - Apprentissage statistique
1.3 - Modélisation hybride
1.4 - Lien avec les solveurs numériques classiques

2 - Modèles hybrides : avantages et champs d’application

2.1 - Problèmes fondamentaux
2.2 - Gains attendus des modèles hybrides

3 - Intégration de connaissance physique dans les modèles d’apprentissage

3.1 - Contraintes sur les données
3.2 - Contraintes sur les fonctions de coût
3.3 - Contraintes sur l’architecture des modèles
3.4 - Contraintes lors de l’inférence
3.5 - Intégration modulaire
3.6 - Modélisation résiduelle

4 - Application à la prévision photovoltaïque par images au sol

4.1 - Contexte de l’étude

Figure 4 - Exemple d’image fisheye
4.2 - Modèle de prévision PhyDNet
4.3 - Résultats expérimentaux de prédiction

Tableau 1

5 - Conclusion et perspectives

6 - Glossaire

7 - Sigles, notations et symboles

Bibliographie & annexes

Présentation

RÉSUMÉ

Cet article traite de l’apprentissage statistique inspiré par la physique qui est une technique exploitant de la connaissance physique potentiellement incomplète et des données pour modéliser des systèmes physiques. Ces modèles dits "hybrides" permettent d’accélérer les simulations numériques, d’utiliser les données de manière plus efficace et de fournir des prédictions plus interprétables et qui généralisent mieux. Cet article présente également une application industrielle à EDF pour la prévision à court terme de la production photovoltaïque à l’aide de caméras au sol.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

Vincent LE GUEN : Chercheur - EDF R&D, Chatou - SINCLAIR AI Lab, Palaiseau

INTRODUCTION

La recherche scientifique a été profondément bouleversée au cours du XX^e siècle par le développement de l’informatique et de l’intelligence artificielle (IA). Le paradigme traditionnel de mise en équations théoriques et validation expérimentale a été appuyé par le recours à la simulation numérique qui est devenu incontournable pour analyser des systèmes complexes en physique, ingénierie, biologie, etc.

Avec l’automatisation des expériences et la multiplication exponentielle du nombre de capteurs, un déluge de données d’observation sont désormais rendues disponibles. Pour extraire de l’information pertinente de ces données et alimenter la découverte scientifique, l’apprentissage statistique (machine learning), en particulier l’apprentissage profond (deep learning), est particulièrement attrayant. L’apprentissage profond a permis au cours de la dernière décennie des progrès spectaculaires dans les domaines de la vision par ordinateur, du traitement du langage naturel ou des jeux, grâce à sa capacité à extraire des relations non linéaires complexes à partir de données massives et à construire des modèles prédictifs. Dans le domaine industriel, ces méthodes d’IA ouvrent la voie au développement de jumeaux numériques, permettant de simuler des systèmes complexes beaucoup plus rapidement qu’avec les techniques de résolution traditionnelles et d’extrapoler les résultats à de nouvelles configurations.

Toutefois, les méthodes d’apprentissage profond nécessitent de très grandes bases de données étiquetées de bonne qualité pour l’entraînement, ce qui n’est pas toujours possible pour certaines expériences scientifiques très coûteuses. En outre, les méthodes purement basées sur les données sont souvent considérées comme des boîtes noires peu explicables, souffrent de problèmes de généralisation en dehors de leur domaine d’entraînement et peuvent produire des prédictions physiquement incohérentes.

Introduire de la connaissance physique dans les méthodes d’apprentissage est une voie très prometteuse pour résoudre ces problèmes. On peut définir l’apprentissage statistique inspiré par la physique (physics-inspired machine learning) comme un paradigme visant à construire des modèles qui exploitent à la fois des données d’observation et de la connaissance physique a priori pour résoudre des tâches qui sont basées sur un processus physique sous-jacent. Ces idées d’hybridation sont assez anciennes mais ont connu un fort regain d’intérêt avec les succès de l’apprentissage profond moderne.

Cet article fait une revue des connaissances actuelles sur les méthodes d’hybridation entre apprentissage statistique et connaissance a priori, en se concentrant sur l’étude de phénomènes physiques. Les principales stratégies d’hybridation sont présentées et les avantages et domaines d’applications de ces méthodes sont discutés. L’article présente également une application industrielle à EDF pour la prévision de la production photovoltaïque à partir de caméras au sol, pour laquelle un modèle d’apprentissage profond hybride a été développé. Enfin, l’article ouvre sur les principaux défis scientifiques et industriels à venir de ces méthodes.

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ? Se connecter

MOTS-CLÉS

physique apprentissage profond apprentissage statistique modèles hybrides

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-in703

CET ARTICLE SE TROUVE ÉGALEMENT DANS :

Accueil > Ressources documentaires > Innovation > Innovations technologiques > Innovations en énergie > Apprentissage statistique inspiré par la physique - Principes et application à la prévision d’énergie photovoltaïque > Conclusion et perspectives

Lecture en cours
Présentation

Page
suivante

Glossaire

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(235 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

5. Conclusion et perspectives

Cet article a présenté les principes fondamentaux de l'apprentissage statistique inspiré par la physique. Ce domaine est très vaste et se caractérise par l’utilisation de concepts de la physique conjointement avec des méthodes d’apprentissage à l’aide de données pour traiter des problèmes physiques. Ces méthodes dites « hybrides » sont un sujet émergent qui suscite un intérêt majeur pour de nombreuses communautés scientifiques. La physique peut être incorporée dans l’apprentissage de modèles de plusieurs manières : par une sélection appropriée des données d’apprentissage, sous la forme de contraintes douces dans la fonction de perte, comme des contraintes dures dans les architectures des réseaux de neurones ou de manière modulaire. Du point de vue apprentissage, ces contraintes physiques permettent de développer des modèles plus interprétables qui se conforment aux lois physiques et qui restent robustes en présence de données bruitées. Cela se traduit typiquement par une plus grande efficacité dans l’utilisation des données et de meilleures performances d’extrapolation au-delà du domaine d’apprentissage. Ces modèles hybrides ont également l’avantage d’être très flexibles et de pouvoir incorporer plusieurs niveaux de connaissance physique.

L’apprentissage statistique inspiré par la physique est un champ d’étude relativement récent et il reste de nombreux défis à relever, notamment :

jeux de données comparaison (benchmarks) : les succès de l’apprentissage profond dans des domaines tels que la vision par ordinateur ou le traitement du langage sont en grande partie dus à l’existence de vastes bases de données étiquetées et standardisées, librement accessibles (par exemple le jeu de données ImageNet en classification d’images). Elles permettent d’encourager l’émulation entre équipes de recherche et d’évaluer précisément les avancées algorithmiques. Ce type de jeu de données de référence est manquant en raison de la diversité des contextes physiques. Si un tel jeu était construit, avec un faible nombre d’équations représentatives et éventuellement plusieurs niveaux de connaissance physique, cela pourrait accélérer grandement la recherche dans ce domaine ;
problèmes multiéchelle et multiphysique : malgré les succès...

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.