Base de données
Paramétrisation qualitative des caractéristiques temps-fréquence pour la reconnaissance du locuteur
RE97 v1 RECHERCHE ET INNOVATION

Base de données
Paramétrisation qualitative des caractéristiques temps-fréquence pour la reconnaissance du locuteur

Auteur(s) : Nidhal BEN ALOUI, Hervé GLOTIN, Patrick HEBRARD, Odile PAPINI

Date de publication : 10 févr. 2009 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Sommaire

Présentation

Auteur(s)

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

Suite aux travaux réalisés dans le domaine de l'anthropométrie, la biométrie est une technique moderne qui répond à une préoccupation ancienne de prouver l'identité d'une personne de manière indiscutable en utilisant ses caractéristiques physiques ou comportementales. Dans cet article, nous proposons d'étudier une nouvelle approche pour la reconnaissance automatique du locuteur (RAL). Notre méthode consiste à reconnaître une personne à partir d'un certain nombre de paramètres, extraits du signal vocal émis par la personne, et représentés originalement de manière qualitative contrairement aux paramétrisations de l'état de l'art.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-re97

Lecture en cours
Présentation

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

4. Base de données

La ressource principale de nos expérimentations est un corpus issu de la campagne d'évaluation Evaluation Campaign for the Rich Transcription of French Broadcast News (ESTER). Au paragraphe 5 nous présentons les résultats de nos expérimentations. Ce corpus acoustique de la phase 1 provient de deux sources différentes, France Inter (Inter) et Radio France International (RFI).

Ce corpus est divisé en trois parties : l'ensemble d'apprentissage, de développement et de test. L'ensemble d'apprentissage contient 60 heures et l'ensemble de développement (dev) contient 8 heures et 30 minutes. L'ensemble de validation (test) aussi. Les sources non vues dans les données de test sont utilisées pour évaluer l'impact des connaissances du document source sur les performances. Les données ont été enregistrées entre 1998 et 2003.

Les vecteurs ci-dessous donnent le nombre d'exemples valables de l'ensemble d'apprentissage et de développement pour chacun des 50 locuteurs.

h_train07 = [359 437 959 88 436 37 1523 338 9 2 54 76 2 167 117 8 197 49 1 227 19 36 66 851 37 22 1046 621 4 2 3 95 12 54 2350 82 601 386 194 1109 145 56 2 61 2201 291 36 584 48 2066] ;

h_dev07 = [85 102 260 22 94 8 395 64 3 1 20 22 1 51 29 1 63 11 0 59 5 8 17 217 8 6 278 149 1 0 0 23 3 9 531 33 151 86 44 265 33 13 2 13 555 69 9 157 16 550] ;

HAUT DE PAGE
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Base de données

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - ALLEN (J.F.) -   An interval-based representation of temporal knowledge  -  In Proceedings of 7th IJCAI, IJCAI, p. 221-226 (1981).

  • (2) - ALLEN (J.F.) -   Maintaining knowledge about temporal intervals  -  Communications of the ACM, 26(11), p. 832-843 (1983).

  • (3) - ALLEN (J.B.) -   How do humans process and recognize speech ?  -  In IEEE Trans. On Speech and Signal Processing, volume 2, p. 567-576 (1994).

  • (4) - BERTHOMMIER (F.), GLOTIN (H.) -   A new snr-feature mapping for robust multistream speech recognition  -  In Proc. Int. Congress on Phonetic Sciences (ICPhS), volume 1 of XIV, p. 711-715, Berkeley University Of California, Ed., San Francisco (1999).

  • (5) - GALLIANO (S.), GEOFFROIS (E.), MOSTEFA (D.), CHOUKRI (K.), BONASTRE (J.-F.), GRAVIER (G.) -   The ester phase 2 : Evaluation campaign for the rich transcription of french broadcast news  -  European Conf. on Speech Communication and Technology, p. 1149-1152 (2005).

  • ...

1 Annexe

Base documentaire Sécurité des systèmes d'information

DORIZZI (B.), LEROUX LES JARDINS (J.), LAMADELAINE (P.), GUERRIER (C.) - La biométrie, techniques et usages - (2004).

HAUT DE PAGE

2 Sites Internet

LSIS

http://www.Isis.org

DCNS

http://www.dcnsgroup.com

HAUT DE PAGE
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(66 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Le temps dans les documents - Langage SMIL

L'accès de plus en plus aisé aux contenus multimédias suscite naturellement l'envie de réaliser des « ...

Génération de fréquence

Cet article traite des générations de fréquence présentes notamment dans les oscillateurs et les ...