Présentation
RÉSUMÉ
Les modèles markoviens cachés sont un outil essentiel pour le traitement, l’exploration, la classification, l’étiquetage, le clustering de données séquentielles et de signaux complexes. Ils ont été intensivement utilisés pour des tâches liées au traitement de signaux et séquences véhiculant un message linguistique tels que le signal de parole, le signal d’écriture, le texte. Ils ont été également utilisés pour traiter divers autres types de signaux en bio-informatique, de séquences de navigation et d’interaction homme-machine, etc.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
Hidden Markov models are an essential tool for the treatment, exploration, classification, labeling and clustering of sequential data and complex signals. They have been intensively used for tasks linked to the processing of signals and sequences conveying a linguistic message such as speech signal, write signal or text. They have also been used to process various types of other signals in bio-computing, navigation sequences and man-machine interaction.
Auteur(s)
-
Thierry ARTIÈRES : Professeur d’informatique - Laboratoire d’informatique de Paris 6 (LIP6) - Université Pierre et Marie Curie (UPMC)
INTRODUCTION
Les modèles markoviens sont une famille de modèles statistiques pour le traitement, l’analyse, la classification de données structurées. Cet article est focalisé sur une instance de ces modèles, les modèles markoviens cachés (MMC), qui ont été et restent très utilisés dans des domaines de classification et d’étiquetage de séquences et de signaux complexes. Ils ont été intensivement utilisés pour des tâches liées au traitement de signaux et séquences véhiculant un message linguistique tels que le signal de parole , le signal d’écriture , le texte. Ils ont été également utilisés pour traiter divers autres types de signaux en bio-informatique, de séquences de navigation et d’interaction homme-machine, etc.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Mathématiques
(202 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
5. Usage pour la classification et l’étiquetage de séquences
5.1 Usage pour la classification de séquences
On distingue souvent la tâche de classification de séquences de la tâche de segmentation (ou étiquetage) de séquences. Pour concevoir un système de classification de séquences on dispose d’une base d’apprentissage B = {(xk, yk), k = 1... K} où yk ∈ {U1, U2,..., UM} désigne la classe de la séquence.
Un système de classification de séquences à base de modèles markoviens cachés est appris par maximisation d’un critère. Le plus simple et le plus utilisé est le critère de maximum de vraisemblance mais d’autre critères peuvent être utilisés (voir § 5.2). Le critère du maximum de vraisemblance a le mérite d’être simple à mettre en œuvre, bénéficiant d’algorithmes de type EM comme l’algorithme de Baum-Welch vu précédemment. Ce critère n’étant pas discriminant les paramètres optimaux du modèle d’une classe ne dépendent pas des paramètres des modèles des autres classes si bien que l’apprentissage peut être réalisé classe par classe, le modèle de la classe Uc peut être appris à partir d’un sous-ensemble de B, Bc = {(xk, yk) tel que (xk, yk) ∈ B, yk = Uc}.
La classification de séquences est réalisée à l’aide d’une structure du type de celle de la figure 14 où l’on dispose d’un modèle par classe. Souvent le modèle de chaque classe a une structure gauche-droite afin d’encoder dans la structure du modèle la structure connue a priori des séquences. Par exemple, si l’on réalise de la classification de sons correspondant à des phonèmes on utilise un modèle gauche-droite par phonème pour prendre en compte le fait qu’un phonème est un enchaînement particulier de sons (début, milieu, fin) et qu’une inversion dans ces sons ne correspond plus au même phonème.
La classification...
Cet article fait partie de l’offre
Mathématiques
(202 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Usage pour la classification et l’étiquetage de séquences
BIBLIOGRAPHIE
-
(1) - RABINER (L.R.) - * - . – A tutorial on hidden markov models and selected applications in speech recognition, in : Proceedings of the IEEE, pp. 257-286 (1989).
-
(2) - HU (J.), LIM (S.G.), BROWN (M.K.) - Writer independent on-line handwriting recognition using an hmm approach - Pattern Recognition 33 (1) 133-147 (2000).
-
(3) - RABINER (L.), JUANG (B.-H.) - Fundamentals of speech recognition - Prentice-Hall, Inc., Upper Saddle River, NJ, USA (1993).
-
(4) - BERTSEKAS (D.), NEDIC (A.), OZDAGLAR (A.) - Convex Analysis and Optimization, Athena Scientific optimization and computation series - Athena Scientific (2003).
-
(5) - BILMES (J.) - Natural statistical models for automatic speech recognition - Ph.D. thesis, U.C. Berkeley, Dept. of EECS, CS Division (1999).
-
(6) - JUANG (B.-H.), RABINER (L.) - The segmental k-means algorithm for estimating...
DANS NOS BASES DOCUMENTAIRES
ANNEXES
Liste Wikipedia des outils développés pour la reconnaissance de la parole : http://en.wikipedia.org/wiki/List-of-speech-recognition-software
HAUT DE PAGECet article fait partie de l’offre
Mathématiques
(202 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive