Présentation
RÉSUMÉ
Les modèles markoviens cachés sont un outil essentiel pour le traitement, l’exploration, la classification, l’étiquetage, le clustering de données séquentielles et de signaux complexes. Ils ont été intensivement utilisés pour des tâches liées au traitement de signaux et séquences véhiculant un message linguistique tels que le signal de parole, le signal d’écriture, le texte. Ils ont été également utilisés pour traiter divers autres types de signaux en bio-informatique, de séquences de navigation et d’interaction homme-machine, etc.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
Hidden Markov models are an essential tool for the treatment, exploration, classification, labeling and clustering of sequential data and complex signals. They have been intensively used for tasks linked to the processing of signals and sequences conveying a linguistic message such as speech signal, write signal or text. They have also been used to process various types of other signals in bio-computing, navigation sequences and man-machine interaction.
Auteur(s)
-
Thierry ARTIÈRES : Professeur d’informatique - Laboratoire d’informatique de Paris 6 (LIP6) - Université Pierre et Marie Curie (UPMC)
INTRODUCTION
Les modèles markoviens sont une famille de modèles statistiques pour le traitement, l’analyse, la classification de données structurées. Cet article est focalisé sur une instance de ces modèles, les modèles markoviens cachés (MMC), qui ont été et restent très utilisés dans des domaines de classification et d’étiquetage de séquences et de signaux complexes. Ils ont été intensivement utilisés pour des tâches liées au traitement de signaux et séquences véhiculant un message linguistique tels que le signal de parole , le signal d’écriture , le texte. Ils ont été également utilisés pour traiter divers autres types de signaux en bio-informatique, de séquences de navigation et d’interaction homme-machine, etc.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Mathématiques
(202 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
4. Les modèles de Markov cachés en pratique
4.1 Prétraitements et extraction de caractéristiques
Quelles que soient les données ou signaux que l’on souhaite exploiter avec des modèles de Markov cachés il faut tout d’abord mettre en forme ces données. Ces prétraitements et cette extraction de caractéristiques peuvent être assez complexes et bénéficier d’une connaissance a priori forte sur les signaux, comme c’est le cas en reconnaissance automatique de la parole.
Par exemple la figure 12 montre le processus par lequel on prétraite un signal d’écriture pour le mettre en forme en entrée d’un système markovien. L’image du mot (ou de la phrase) est découpée en petites fenêtres en faisant glisser une fenêtre étroite de la gauche vers la droite. Pour chaque position de la fenêtre, on calcule un certain nombre de caractéristiques. Par exemple on peut diviser la fenêtre en six parties et calculer la densité de pixels noirs dans chacune des parties, ce qui donne un vecteur réel à six composantes. Le mot peut alors être représenté par la séquence des vecteurs de caractéristiques correspondant à une fenêtre d’analyse glissant de la gauche de l’image vers la droite.
Au final, quel que soit le signal sur lequel on travaille, il doit être prétraité sous forme d’une séquence de vecteurs de caractéristiques pour être exploité par des modèles de Markov cachés tels que ceux décrits dans cet article.
HAUT DE PAGE4.2 Initialisation
Comme nous l’avons vu l’apprentissage de modèles markoviens cachés est réalisée par l’optimisation d’un critère. Qu’il s’agisse du critère de vraisemblance ou d’un critère discriminant, lorsque les données d’apprentissage ne sont que partiellement étiquetées comme c’est le cas généralement, l’apprentissage est un problème d’optimisation non convexe pour lequel aucun algorithme ne peut garantir une convergence vers un optimum global. L’initialisation est donc une étape essentielle de l’apprentissage.
On distingue généralement deux cas suivant la topologie du modèle que l’on souhaite apprendre. Nous détaillons cette procédure pour les deux topologies les plus répandues :...
Cet article fait partie de l’offre
Mathématiques
(202 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Les modèles de Markov cachés en pratique
BIBLIOGRAPHIE
-
(1) - RABINER (L.R.) - * - . – A tutorial on hidden markov models and selected applications in speech recognition, in : Proceedings of the IEEE, pp. 257-286 (1989).
-
(2) - HU (J.), LIM (S.G.), BROWN (M.K.) - Writer independent on-line handwriting recognition using an hmm approach - Pattern Recognition 33 (1) 133-147 (2000).
-
(3) - RABINER (L.), JUANG (B.-H.) - Fundamentals of speech recognition - Prentice-Hall, Inc., Upper Saddle River, NJ, USA (1993).
-
(4) - BERTSEKAS (D.), NEDIC (A.), OZDAGLAR (A.) - Convex Analysis and Optimization, Athena Scientific optimization and computation series - Athena Scientific (2003).
-
(5) - BILMES (J.) - Natural statistical models for automatic speech recognition - Ph.D. thesis, U.C. Berkeley, Dept. of EECS, CS Division (1999).
-
(6) - JUANG (B.-H.), RABINER (L.) - The segmental k-means algorithm for estimating...
DANS NOS BASES DOCUMENTAIRES
ANNEXES
Liste Wikipedia des outils développés pour la reconnaissance de la parole : http://en.wikipedia.org/wiki/List-of-speech-recognition-software
HAUT DE PAGECet article fait partie de l’offre
Mathématiques
(202 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive