Contactez-nous
Perspectives et conclusion
Reconnaissance automatique de la parole
H3728 v2 Archive

Perspectives et conclusion
Reconnaissance automatique de la parole

Auteur(s) : Jean-Paul HATON

Date de publication : 10 nov. 2012

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Caractéristiques de la communication parlée homme-machine

2 - Domaines de la reconnaissance automatique de la parole

3 - Analyse du signal de parole

4 - Reconnaissance de mots

5 - Reconnaissance et compréhension de la parole continue

6 - Méthodes robustes pour la reconnaissance

7 - Perspectives et conclusion

Sommaire

Présentation

Auteur(s)

  • Jean-Paul HATON : Professeur à l'Université de Lorraine, LORIA/INRIA - Membre de l'Institut universitaire de France

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

L'utilisation de la parole comme mode de communication entre un homme et une machine a été largement étudiée au cours des dernières décennies. Nous nous intéressons dans ce dossier à la reconnaissance automatique de la parole (RAP), c'est-à-dire à l'ensemble des techniques permettant de communiquer oralement avec une machine. La RAP présente un intérêt pratique indéniable, dans certaines conditions d'utilisation (accès à distance, charge de travail importante, handicapés, etc.). Des produits commerciaux existent depuis plus de trente ans, d'abord essentiellement pour la reconnaissance de mots isolés et enchaînés puis maintenant pour des phrases prononcées continûment. La plupart sont fondés sur des algorithmes de programmation dynamique et des modèles stochastiques (sources de Markov). Néanmoins, des problèmes restent à résoudre pour accroître la robustesse de ces systèmes et pour étendre leurs capacités de dialogue. Les recherches menées actuellement portent ainsi sur la reconnaissance de parole bruitée, le traitement d'énoncés incomplets ou incorrects, la définition de procédures de dialogue, etc.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


VERSIONS

Il existe d'autres versions de cet article :

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v2-h3728

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(68 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

7. Perspectives et conclusion

Après plus de soixante années de recherches et de développement industriel, les performances des systèmes de RAP se sont considérablement améliorées, permettant d'aborder des domaines d'application de complexité croissante. Les travaux actuels les plus avancés concernent des systèmes de dialogue via le téléphone, la reconnaissance de la parole spontanée ou la transcription d'émissions de radio ou télévision. Les performances obtenues dépendent beaucoup du type de tâche considérée (taille et difficulté du vocabulaire, locuteurs, conditions d'enregistrement).

Le traitement automatique de la parole a été dès l'origine fortement tributaire de l'évolution technologique. D'abord purement en électronique analogique, les systèmes de RAP ont ensuite été implantés sur ordinateur. Les progrès de la microélectronique permettent la miniaturisation et l'implantation de systèmes complexes de RAP sous forme logicielle ou sur une puce et, de ce fait, leur utilisation dans des secteurs d'activité très variés, en particulier en lien avec le développement de la télématique vocale.

Malgré ces avancées, les systèmes actuels sont encore imparfaits. Les problèmes à résoudre représentent un des défis les plus difficiles posés à l'intelligence artificielle. Un important effort de recherche est nécessaire, notamment sur le plan de la robustesse des méthodes de reconnaissance et de la conception de systèmes de dialogue.

Les travaux à mener nécessitent un effort pluridisciplinaire de collecte de signal vocal, mais aussi de modélisation d'un ensemble de faits et de connaissances sur la langue naturelle et sur les mécanismes de la communication parlée. Nous avons vu qu'une modélisation stochastique permet de résoudre en partie le problème, mais il n'est pas exclu que l'utilisation de connaissances explicites revienne à l'ordre du jour à l'avenir.

Ainsi, la parole pourra devenir un des modes de communication privilégiés des futurs systèmes intelligents d'aide à l'utilisateur, dans des domaines d'activité variés.

HAUT DE PAGE
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Perspectives et conclusion

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(68 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - RABINER (L.), HUANG (B.H.) -   Fundamentals of speech recognition.  -  Prentice-Hall, Englewood Cliffs (1993).

  • (2) - JUNQUA (J.-C.), HATON (J.-P.) -   Robustness in automatic speech recognition.  -  Kluwer Academic, Dordrecht (1996).

  • (3) - BOITE (R.), BOURLARD (H.), DUTOIT (T.), HANCQ (J.), LEICH (H.) -   Traitement de la parole.  -  Presses polytechniques et universitaires romandes, Lausanne (2000).

  • (4) - MINKER (W.), BENNACEF (S.) -   Reconnaissance vocale et dialogue homme-machine.  -  Eyrolles, Paris (2000).

  • (5) - MARIANI (J.) (éd.) -   Reconnaissance de la parole : traitement automatique du langage parlé.  -  Hermes – Science – Lavoisier, Paris (2002).

  • (6) - COHEN (M.), GIANGOLA (J.), BALOGH (J.) -   Voice user interface design.  -  Addison-Wesley,...

1 Outils logiciels

HTK (HMM ToolKit) : logiciel libre destiné au développement d'applications complètes de reconnaissance de la parole fondées sur MMC https://htk.eng.cam.ac.uk/

VISPER (Visual speech processing system  ) : logiciel libre permettant de visualiser les étapes de reconnaissance par programmation dynamique et par MMC développé par l'Université Technique de Liberec, Tchéquie https://www.ite.tul.cz/speechlabe/index.php/old-projects/visper.html

SNOORI : logiciel libre d'analyse, de visualisation et d'étiquetage de la parole développé au LORIA par Yves Laprie pour les recherches en phonétique, perception et traitement automatique de la parole

Bases de données de parole étiquetée disponibles pour de nombreuses langues par l'intermédiaire des organismes :

LDC, Linguistic Data Consortium http://www.ldc.upenn.edu/

ELRA, European Language Resources Association http://www.elra.info/

Dragon Naturally Speaking de Nuance https://www.nuance.com/fr-fr/dragon.html

HAUT DE PAGE

2 Annuaire

...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(68 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Méthodes numériques de base - Analyse numérique

L’analyse numérique étudie les méthodes, appelées constructives, de résolution numérique des problèmes. ...

Calcul des valeurs propres

Calculer les valeurs propres et les vecteurs propres de matrices est un important problème en analyse ...

Interpolation, approximation et extrapolation rationnelles

Le but de cet article est de présenter les méthodes d'interpolation et d'approximation par des fonctions ...