Le lancement d’AMI Labs marque un changement d’échelle dans la trajectoire de Yann LeCun. La société, installée à Paris, a levé plus d’un milliard de dollars pour une valorisation de 3,5 milliards de dollars, ce qui la fait entrer d’emblée dans la catégorie des licornes, avec une équipe fondatrice issue en grande partie de l’écosystème de Meta et de la recherche en intelligence artificielle. Cette opération place immédiatement le projet dans le champ des acteurs mondiaux capables d’investir massivement dans les infrastructures de calcul, le recrutement scientifique et le développement de nouveaux modèles.
Cette création d’entreprise prolonge une conviction déjà formulée fin 2025, lorsque l’idée d’une « intelligence avancée » était opposée à ce qui était présenté comme l’illusion d’une montée en puissance illimitée des LLM. Ces grands modèles de langage étaient décrits comme utiles pour produire du texte ou du code, mais insuffisants pour atteindre une compréhension robuste du monde physique, de la causalité et de la logique. La différence d’approche qui apparaît aujourd’hui tient au fait que ce constat n’est plus seulement théorique. Il devient la base d’un programme industriel structuré autour d’une nouvelle génération de modèles d’IA.
Auparavant, l’accent était mis sur la limite intrinsèque des LLM. Le cœur du raisonnement reposait sur l’idée que ces systèmes fonctionnent par prédiction autorégressive, sans ancrage direct dans le réel, et qu’ils demeurent vulnérables aux hallucinations, précisément parce qu’ils ne comprennent pas le monde qu’ils décrivent. Avec AMI Labs, le discours se déplace légèrement. Il ne s’agit plus seulement d’affirmer que les LLM ne suffiront pas, mais de soutenir que les world models1 constituent une voie complémentaire pour résoudre des tâches plus complexes, à partir de vidéos, d’environnements 3D et de données spatiales. Cette nuance est importante, car elle remplace une opposition frontale par une logique d’extension des capacités de l’IA.
Des world models pour comprendre et anticiper le réel
L’architecture mise en avant s’inscrit dans le prolongement des travaux sur JEPA (Joint Embedding Predictive Architecture), conçue pour apprendre des représentations abstraites d’images ou de vidéos et mieux modéliser la dynamique du monde réel. Elle est notamment présentée comme une alternative aux modèles génératifs classiques. Là où un modèle génératif cherche à reconstruire des détails, JEPA vise des représentations abstraites qui captent l’essentiel d’une scène ou d’une situation, ce qui doit permettre d’apprendre plus efficacement à partir du monde observable. Dans la continuité de cette logique, AMI Labs affirme vouloir construire des systèmes capables de comprendre le monde réel, de disposer d’une mémoire persistante, de raisonner et planifier, tout en restant contrôlables et sûrs.
Le passage de la théorie à l’entreprise modifie aussi la portée du projet. Les applications évoquées concernent la robotique, l’industrie, la simulation numérique ou encore certains usages du divertissement, c’est-à-dire des domaines dans lesquels l’interaction avec le monde physique, la prévision d’actions et l’évaluation de leurs conséquences sont centrales. La société a d’ailleurs indiqué que sa première phase serait consacrée à la recherche avant une confrontation progressive à des partenaires commerciaux, ce qui confirme une volonté de transformer une intuition scientifique en infrastructure applicable.
Une divergence stratégique devenue projet industriel
La différence la plus nette entre la phase de réflexion sur les limites des LLM et le lancement d’AMI Labs tient à la transformation d’une conviction théorique en projet industriel. L’argumentation initiale insistait en effet sur la bulle spéculative entourant les LLM et sur la nécessité d’une meilleure architecture pour rapprocher l’IA d’une forme de compréhension réelle. Désormais, cette orientation s’est concrétisée pour devenir une entreprise mondiale financée par un large consortium d’investisseurs, organisée autour d’une équipe de recherche expérimentée, et dotée de moyens pour développer ses propres modèles.
En ce sens, Yann LeCun ne se contente plus de souligner les limites de l’horizon des LLM. Il cherche à installer une autre grammaire de l’intelligence artificielle, dans laquelle le langage ne serait plus le point de départ unique de l’intelligence machine, mais une composante d’un système plus large ancré dans le monde. L’enjeu n’est donc pas seulement de proposer un concurrent aux modèles dominants, mais d’orienter autrement la recherche et, potentiellement, celui des futurs usages industriels de l’IA.
1 Les world models désignent des systèmes d’intelligence artificielle conçus pour apprendre une représentation du monde physique et en anticiper l’évolution, afin de mieux raisonner, planifier et agir.
Dans l'actualité
- Yann LeCun fait le pari de l’«Intelligence Avancée» face à l’illusion des LLM
- El-Ghazali Talbi : « Intelligence artificielle : le mur énergétique »
- L’intelligence artificielle : le super assistant de la médecine
- L’intelligence artificielle, un outil d’évolution pour les industries du futur
- Comprendre les enjeux d’un Système de Management de l’Intelligence Artificielle (SMIA)
- L’usage des petits modèles de langage pourrait rendre l’IA plus accessible et responsable
- Mistral annonce son premier modèle de raisonnement : Magistral
Dans les ressources documentaires
- L’intelligence artificielle générative
- Systèmes à bases de connaissances
- Optimiser l’IA générative avec le RAG - La génération de réponses à partir de LLMs, augmentée par la recherche d’information
- Identification de modèles dans l’espace d’état
- La simulation numérique : un outil pour les innovations technologiques