Un projet de recherche européen va créer une encyclopédie des odeurs du passé. Des algorithmes vont être développés afin d'extraire toutes les informations faisant référence aux odeurs dans des écrits et des images datant du XVIe au XXe siècle.

La musique, l’opéra, la peinture, la calligraphie, le chant traditionnel… sont aujourd’hui considérés comme faisant partie du patrimoine immatériel de l’humanité. Ils font d’ailleurs l’objet de mesures de sauvegarde de la part de l’Unesco. Tous ces domaines ont pour points communs de faire appel à deux sens très utilisés chez l’homme, à savoir la vue et l’ouïe. Jusqu’ici, l’odorat n’a jamais été considéré comme l’un des sens devant être conservé. La Commission européenne, à travers son programme H2020, vient de sélectionner un projet dont l’objectif est de créer une encyclopédie des odeurs du passé. Financé à hauteur de 2,8 millions d’euros, il regroupe une quarantaine de chercheurs européens dont des historiens d’art, des linguistes, des spécialistes des odeurs mais aussi… des informaticiens. L’intelligence artificielle va en effet jouer un rôle crucial dans ce programme de recherche nommé Odeuropa.

Pour le mener à bien, les chercheurs vont reconstituer les odeurs allant du XVIe au XXe siècle en Europe à partir des écrits et des images de cette époque. Un inventaire du matériel primaire utilisé a déjà été réalisé. Des dizaines de milliers de textes rédigés dans sept langues différentes, dont le latin, ont été recensés. Entre 250 000 et 400 000 images ont également été répertoriées comme des dessins et des tableaux. Tous ces documents proviennent de bibliothèques et des musées disséminés aux quatre coins de l’Europe et présentent l’avantage d’être déjà numérisés.

Un surentraînement de l’algorithme sera nécessaire

Il existe déjà des algorithmes entraînés pour reconnaître des noms de lieux, des personnes, des expressions temporelles… C’est grâce à eux par exemple que des assistants conversationnels comme Google Home, Siri ou Alexa fonctionnent. Mais dès que le champ lexical devient spécialisé, il devient nécessaire d’entraîner la machine à reconnaître ce nouveau domaine. Les informaticiens vont dans un premier temps surentraîner l’algorithme afin qu’il soit en mesure d’extraire toutes les mentions faisant référence aux odeurs. Pour cela, ils vont lui donner un grand nombre de vocabulaires, de lexiques, de glossaires relatifs aux odeurs ainsi qu’aux émotions associées. « Dans cette phase d’amorçage, nous allons analyser dans quelle mesure la machine réussit à reconnaître ces termes, ces mentions spécifiques dans les documents, puis nous regarderons quels sont ceux les plus fréquemment employés, explique Raphaël Troncy, enseignant-chercheur à Eurecom. À partir de là, nous verrons si nous avons besoin d’augmenter notre champ lexical. »

Cette étape ne sera pas suffisante. Au-delà du champ lexical lié aux odeurs, il sera aussi nécessaire de comprendre dans quel contexte il est mentionné, c’est-à-dire à l’occasion de quel événement, quel rite, à quelle période… Les historiens savent déjà que l’odeur du romarin était très présente au moment de la peste, puisque selon la croyance populaire de l’époque, elle permettait de se protéger contre l’épidémie. Mais dans le cas de l’odeur de la rose par exemple, était-elle fréquemment employée à l’occasion des mariages ?

Les informaticiens vont utiliser une autre technique de l’intelligence artificielle : l’apprentissage profond, plus couramment appelé « deep learning ». Ce dernier repose sur la création d’un réseau artificiel de neurones, calqué sur celui des humains. C’est un dérivé du machine learning, c’est-à-dire de l’apprentissage automatique, un processus par lequel l’algorithme est capable d’apprendre par lui-même. Pour ce projet, au fur et à mesure de la lecture des textes, l’algorithme va naturellement commencer à associer des mots avec le contexte dans lequel il est le plus fréquemment employé. « Tous les mots dans un texte n’ont pas le même poids, la même valeur, poursuit le chercheur. L’algorithme va donc porter son attention sur les mots placés avant et après ceux décrivant une odeur. Ensuite, grâce à l’usage du traitement statistique et à la cooccurrence entre les mots ainsi qu’à un processus de mémorisation, il va réussir petit à petit, au fur et à mesure de son entraînement, à définir précisément le contexte. »

S’inspirer des algorithmes utilisés dans la reconnaissance faciale

Concernant les dessins et les peintures, toutes les allégories visuelles relatives au champ olfactif seront également identifiées. Là encore, un algorithme va faire le travail. Dans de nombreux tableaux des XVIe et XVIIe siècles représentant des natures mortes, il devra par exemple repérer les figures faisant référence au sens olfactif comme les fruits. Les chercheurs vont s’inspirer des algorithmes utilisés dans la reconnaissance faciale. Eux aussi fonctionnent grâce à des réseaux de neurones dont le rôle est de convertir chaque image en un prisme numérique. Puis de comparer et analyser toutes les figures entre elles et identifier celles déjà connues comme ayant un lien avec le champ olfactif.

Trois années de travail seront nécessaires pour mener à bien ce programme de recherche. Il devrait se finaliser par la création d’un graphe de connaissance ; il s’agit d’une base de données dans laquelle toutes les informations extraites ont été structurées. L’équipe française d’Eurecom sera en charge de ce travail. « Ce graphe de connaissance sera accessible à des développeurs d’applications à l’état brut, ajoute Raphaël Troncy. Nous allons également développer notre propre application en direction du grand public. Elle prendra la forme d’un moteur de recherche permettant d’explorer, à partir d’une odeur, tous les textes et les images faisant référence à cette odeur et d’en restituer le contexte historique particulier. »

À terme, il est également prévu d’organiser des expositions dans des musées européens. Toutes ces odeurs auront été reconstituées au préalable par des chimistes et des parfumeurs. Le public pourra les sentir durant leur visite afin que l’immersion dans le patrimoine olfactif de l’Europe soit complète.