Résultats expérimentaux
Paramétrisation qualitative des caractéristiques temps-fréquence pour la reconnaissance du locuteur
RE97 v1 RECHERCHE ET INNOVATION

Résultats expérimentaux
Paramétrisation qualitative des caractéristiques temps-fréquence pour la reconnaissance du locuteur

Auteur(s) : Nidhal BEN ALOUI, Hervé GLOTIN, Patrick HEBRARD, Odile PAPINI

Date de publication : 10 févr. 2009 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Sommaire

Présentation

Auteur(s)

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

Suite aux travaux réalisés dans le domaine de l'anthropométrie, la biométrie est une technique moderne qui répond à une préoccupation ancienne de prouver l'identité d'une personne de manière indiscutable en utilisant ses caractéristiques physiques ou comportementales. Dans cet article, nous proposons d'étudier une nouvelle approche pour la reconnaissance automatique du locuteur (RAL). Notre méthode consiste à reconnaître une personne à partir d'un certain nombre de paramètres, extraits du signal vocal émis par la personne, et représentés originalement de manière qualitative contrairement aux paramétrisations de l'état de l'art.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-re97

Lecture en cours
Présentation

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

5. Résultats expérimentaux

Nous observons sur le tableau 1 un pourcentage d'erreur par classe de 78,8 %. En utilisant l'information issue de la matrice des estimations des locuteurs sur la série de fenêtres consécutives, avec un décodage dynamique optimisé sur la base DEV, nous obtenons un taux d'erreur en trame de 23 %. La comparaison avec les résultats de la phase 2 d'ESTER sont prometteurs.

Les résultats préliminaires, utilisant seulement 30 entiers donnent des résultats similaires à un codage 25 fois plus gros. Ces résultats doivent être confirmés sur un plus grand nombre de classes, donc plus de locuteurs.

HAUT DE PAGE
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Résultats expérimentaux

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - ALLEN (J.F.) -   An interval-based representation of temporal knowledge  -  In Proceedings of 7th IJCAI, IJCAI, p. 221-226 (1981).

  • (2) - ALLEN (J.F.) -   Maintaining knowledge about temporal intervals  -  Communications of the ACM, 26(11), p. 832-843 (1983).

  • (3) - ALLEN (J.B.) -   How do humans process and recognize speech ?  -  In IEEE Trans. On Speech and Signal Processing, volume 2, p. 567-576 (1994).

  • (4) - BERTHOMMIER (F.), GLOTIN (H.) -   A new snr-feature mapping for robust multistream speech recognition  -  In Proc. Int. Congress on Phonetic Sciences (ICPhS), volume 1 of XIV, p. 711-715, Berkeley University Of California, Ed., San Francisco (1999).

  • (5) - GALLIANO (S.), GEOFFROIS (E.), MOSTEFA (D.), CHOUKRI (K.), BONASTRE (J.-F.), GRAVIER (G.) -   The ester phase 2 : Evaluation campaign for the rich transcription of french broadcast news  -  European Conf. on Speech Communication and Technology, p. 1149-1152 (2005).

  • ...

1 Annexe

Base documentaire Sécurité des systèmes d'information

DORIZZI (B.), LEROUX LES JARDINS (J.), LAMADELAINE (P.), GUERRIER (C.) - La biométrie, techniques et usages - (2004).

HAUT DE PAGE

2 Sites Internet

LSIS

http://www.Isis.org

DCNS

http://www.dcnsgroup.com

HAUT DE PAGE
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Le temps dans les documents - Langage SMIL

L'accès de plus en plus aisé aux contenus multimédias suscite naturellement l'envie de réaliser des « ...

Génération de fréquence

Cet article traite des générations de fréquence présentes notamment dans les oscillateurs et les ...