Spécialisée dans les technologies de l’audio, la start-up française Ircam Amplify a mis au point une plateforme contenant deux briques qui permettent de vérifier, avec un taux de précision de 98 %, si une chanson ou une voix a été générée par de l’IA. Un algorithme unique au monde.

L’intelligence artificielle est devenue l’assistant préféré des escrocs et de certains États. Cette technologie permet en effet de créer facilement des contenus audio et/ou vidéo destinés à arnaquer des personnes ou à manipuler le grand public.

Ce fléau s’est amplifié depuis la « démocratisation » de l’intelligence artificielle ou GenAI. Les cybercriminels ont recours à la manipulation d’images afin de se faire passer pour des célébrités et piéger leurs victimes. En 2022, dans une fausse vidéo, Elon Musk, le patron de Tesla et de Space X notamment, promettait des rendements élevés dans le cadre d’un plan d’investissement dans les cryptomonnaies.

En 2020, des cybercriminels ont réussi à tromper un directeur de banque aux Émirats arabes unis et à lui voler 35 millions de dollars en utilisant un deepfake vocal.

Les maisons de disques sont aussi touchées par ces arnaques. En avril 2023, un titre des Canadiens Drake et The Weeknd est mis en ligne. Très rapidement, les vidéos créées avec cette bande-son ont généré plus de dix millions de vues sur YouTube et TikTok. Jackpot pour les auteurs de ce… fake.

Moins de 30 secondes pour identifier une fausse chanson

Pour endiguer ce tsunami de faux contenus, l’IA est également appelée à la rescousse. Créé en 2019, la start-up française Ircam Amplify a mis au point AI Music Detector et AI Speech Detector. Ces solutions sont capables d’identifier les contenus vocaux musicaux ou vocaux générés par intelligence artificielle (IA) avec un taux de précision de 98 %.

« Une machine IA va créer des marqueurs qui ne sont pas audibles pour l’être humain, mais grâce à notre expertise du son, nous pouvons les identifier, car chaque moteur a sa propre signature numérique », déclare Frédéric Amadu, Chief Technology Officer d’Ircam Amplify.

« Nous avons développé deux solutions assez similaires, mais qui répondent à des besoins marchés très différents. La première est destinée à repérer de la musique générée par de l’IA. Nous avons utilisé cette même approche pour la seconde solution qui se focalise sur la voix. Pour ce second outil, nous avons travaillé avec des partenaires et des prospects qui nous ont parlé des moteurs d’IA qui les inquiétaient le plus », explique Romain Simiand, directeur produit chez Ircam Amplify.

Leur plateforme, accessible en mode SaaS (Software as a service) c’est-à-dire depuis un navigateur web, met à disposition toutes les briques technologiques développées par l’IRCAM. Elle s’appuie notamment sur dix moteurs d’IA, cinq grand public et cinq open source, ce qui permet de couvrir la majorité des fakes diffusés en ligne.

« Si un deepfake s’appuie sur un moteur d’IA que nous n’avons pas retenu, notre algorithme ne pourra pas le détecter. Mais il va nous alerter en le considérant comme suspect. Dans ce cas, nous réaliserons une analyse plus minutieuse », précise Romain Simiand. Si des dizaines de fakes sont générés régulièrement par un même moteur d’IA, Ircam Amplify pourra l’intégrer à sa plateforme sous un mois.

AI Music Detector n’est pas capable de détecter en temps réel des fakes, mais il peut vérifier l’authenticité d’une chanson en écoutant juste 10 à 30 secondes. « Nous ne pouvons pas détecter en temps réel pour des raisons de priorités et de ressources. Notre objectif est d’intégrer notre solution dans des entreprises qui sont spécialisées dans le temps réel et qui servent notamment des call centers », explique Romain Simiand.

La start-up est en train de finaliser un accord avec l’une des principales majors à propos de la musique générée par l’IA. Sa solution est également auditée par un important cabinet spécialisé dans la cybersécurité pour repérer les arnaques aux faux virements reposant sur des deepfakes.