Trop chers ! Reposant sur des milliards de paramètres et de données, les LLM ont révolutionné la compréhension et le traitement du langage naturel dans l’industrie. Depuis l’avènement de ChatGPT en novembre 2022, l’engouement pour les LLM n’a cessé de croître. Les dépenses mondiales en solutions d’IA de génération pourraient passer de 16 milliards en 2023 à 150 milliards en 2027.
Mais ils présentent aussi des contraintes de coût (à cause notamment d’importantes ressources de calcul), de consommation énergétique et de confidentialité.
L’année 2025 marque un tournant vers des solutions plus compactes et spécialisées. Les Small Language Models (SLM) émergent comme une solution idéale pour des usages ciblés dans les entreprises. Cette montée des SLM s’appuie sur un écosystème open source dynamique, où la communauté partage modèles et scripts pour un entraînement rapide sur des données limitées.
Les petits modèles de langage (SLM) intègrent quelques millions à quelques milliards de paramètres. Plus légers, rapides à entraîner et à déployer, ils représentent une alternative économique aux LLM. Les entreprises y voient un moyen d’optimiser leur ROI (Return on Investment en anglais) ou retour sur investissement.
Ne plus dépendre du cloud
Adaptés à des usages spécialisés, les SLM alimentent des chatbots d’assistance ou des modèles d’analyse de marché. Ils répondent aux besoins de niche sans nécessiter d’énormes jeux de données externes pour l’entraînement. Les entreprises peuvent ainsi affiner ces modèles sur des jeux de données limités pour répondre à des cas d’usage précis sans sacrifier la qualité.
Microsoft, Meta, Google et la start-up française Mistral ont récemment publié des SLM performants et accessibles. Le lancement de PC dotés d’unités de traitement neuronal embarquées facilite l’exécution locale de ces modèles. L’IA ne dépend plus exclusivement des infrastructures coûteuses du cloud.
Autre écueil des LLM : leurs hallucinations, ces réponses inexactes issues de données non structurées. Or, plus un modèle de langage est grand, plus la maîtrise des biais et des fausses réponses devient complexe.
Pour toutes ces raisons, le cabinet d’analystes Gartner estime que les entreprises adopteront trois fois plus de SLM que de LLM généralistes d’ici à 2027. Les experts recommandent de cibler les déploiements spécifiques où les connaissances spécialisées sont déterminantes.
Il pourrait s’agir par exemple d’extraire des informations clés (dates, noms, montants) dans des documents confidentiels ou de recourir à des chatbots formés sur le corpus interne de l’entreprise pour le support RH ou informatique.
Au-delà de ces deux exemples, les SLM peuvent être finement adaptés à tout contexte où l’infrastructure cloud est inadaptée : véhicules autonomes, drones, wearables…
À terme, la stratégie idéale combinera LLM pour les scénarii ouverts et SLM pour les tâches restreintes. Cette approche hybride permettra d’allouer les ressources de calcul de manière optimisée et ciblée. Les entreprises pourront ainsi bénéficier de la puissance des grands modèles tout en limitant les coûts.
Dans l'actualité
- DeepSeek : l’OVNI chinois qui secoue l’IA
- L’IA met la pression sur les datacenters qui doivent réduire leur empreinte carbone
- Similar Tickets : quand l’IA facilite la résolution des problèmes dans l’industrie
- Les grands modèles de langage : de puissants outils qui restent encore à maîtriser
- Pour repérer des bugs dans des logiciels sensibles, des chercheurs font appel à l’IA
- Biais algorithmiques : la sensibilisation commence dès la formation
- Racistes, sexistes, classistes : comment les biais algorithmiques creusent les inégalités ?
- L’IA générative a un impact sur la « pensée critique »
- IA dans les usines : « Quand le « pourquoi » est clair, les freins tombent »
- « Il nous faut une législation agile pour s’adapter au mieux à cette technologie – l’IA – que l’on ne capte pas encore parfaitement »
- « Les entreprises foncent tête baissée dans l’IA sans se poser de questions »
- Mistral annonce son premier modèle de raisonnement : Magistral
- TotalEnergies s’allie à Mistral AI
- Revue du Magazine d’Actualité #42 du 11 au 22 août
- ASML et Mistral AI engagent la souveraineté technologique européenne dans un nouveau virage