1.1 - Illustration d’une application des MMC
1.2 - Applications emblématiques
1.3 - Modélisation par des modèles à états

2 - CHAÎNES DE MARKOV ET AUTOMATES PROBABILISTES À ÉTATS FINIS

2.1 - Chaînes de Markov
2.2 - Illustration
2.3 - Durée de séjour dans un état
2.4 - Estimation et inférence

3 - MODÈLES DE MARKOV CACHÉS : LA THÉORIE

3.1 - Définition et principe
3.2 - Calcul de la vraisemblance d’une séquence observée
3.3 - Inférence du chemin optimal pour une séquence observée
3.4 - Estimation des paramètres à partir d’un corpus d’apprentissage
3.5 - Extension des modèles markoviens cachés

4 - LES MODÈLES DE MARKOV CACHÉS EN PRATIQUE

4.1 - Prétraitements et extraction de caractéristiques
4.2 - Initialisation
4.3 - Estimation de probabilités de transitions sur corpus et pondération a posteriori
4.4 - Implémentation

5 - USAGE POUR LA CLASSIFICATION ET L’ÉTIQUETAGE DE SÉQUENCES

5.1 - Usage pour la classification de séquences
5.2 - Critères d’apprentissage discriminants
5.3 - Usage pour l’étiquetage/segmentation de séquences
5.4 - Apprentissage de modèles d’unités élémentaires pour la segmentation
5.5 - Modèles de Markov cachés et traitement du langage

6 - CONCLUSIONS

Bibliographie & annexes

Article de référence | Réf : AF615 v1

Usage pour la classification et l’étiquetage de séquences
Modèles de Markov cachés pour l’étiquetage de séquences

Auteur(s) : Thierry ARTIÈRES

Date de publication : 10 avr. 2013

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Présentation

RÉSUMÉ

Les modèles markoviens cachés sont un outil essentiel pour le traitement, l’exploration, la classification, l’étiquetage, le clustering de données séquentielles et de signaux complexes. Ils ont été intensivement utilisés pour des tâches liées au traitement de signaux et séquences véhiculant un message linguistique tels que le signal de parole, le signal d’écriture, le texte. Ils ont été également utilisés pour traiter divers autres types de signaux en bio-informatique, de séquences de navigation et d’interaction homme-machine, etc.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

ABSTRACT

Hidden Markov models for sequence labeling

Hidden Markov models are an essential tool for the treatment, exploration, classification, labeling and clustering of sequential data and complex signals. They have been intensively used for tasks linked to the processing of signals and sequences conveying a linguistic message such as speech signal, write signal or text. They have also been used to process various types of other signals in bio-computing, navigation sequences and man-machine interaction.

Auteur(s)

Thierry ARTIÈRES : Professeur d’informatique - Laboratoire d’informatique de Paris 6 (LIP6) - Université Pierre et Marie Curie (UPMC)

INTRODUCTION

Les modèles markoviens sont une famille de modèles statistiques pour le traitement, l’analyse, la classification de données structurées. Cet article est focalisé sur une instance de ces modèles, les modèles markoviens cachés (MMC), qui ont été et restent très utilisés dans des domaines de classification et d’étiquetage de séquences et de signaux complexes. Ils ont été intensivement utilisés pour des tâches liées au traitement de signaux et séquences véhiculant un message linguistique tels que le signal de parole , le signal d’écriture , le texte. Ils ont été également utilisés pour traiter divers autres types de signaux en bio-informatique, de séquences de navigation et d’interaction homme-machine, etc.

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-af615

Cet article fait partie de l’offre

Mathématiques

(202 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

Page
suivante

Conclusions

5. Usage pour la classification et l’étiquetage de séquences

5.1 Usage pour la classification de séquences

On distingue souvent la tâche de classification de séquences de la tâche de segmentation (ou étiquetage) de séquences. Pour concevoir un système de classification de séquences on dispose d’une base d’apprentissage B = {(x^k, y^k), k = 1... K} où y^k ∈ {U₁, U₂,..., U_M} désigne la classe de la séquence.

Un système de classification de séquences à base de modèles markoviens cachés est appris par maximisation d’un critère. Le plus simple et le plus utilisé est le critère de maximum de vraisemblance mais d’autre critères peuvent être utilisés (voir § 5.2 ). Le critère du maximum de vraisemblance a le mérite d’être simple à mettre en œuvre, bénéficiant d’algorithmes de type EM comme l’algorithme de Baum-Welch vu précédemment. Ce critère n’étant pas discriminant les paramètres optimaux du modèle d’une classe ne dépendent pas des paramètres des modèles des autres classes si bien que l’apprentissage peut être réalisé classe par classe, le modèle de la classe U_c peut être appris à partir d’un sous-ensemble de B, B^c = {(x^k, y^k) tel que (x^k, y^k) ∈ B, y^k = U_c}.

La classification de séquences est réalisée à l’aide d’une structure du type de celle de la figure 14 où l’on dispose d’un modèle par classe. Souvent le modèle de chaque classe a une structure gauche-droite afin d’encoder dans la structure du modèle la structure connue a priori des séquences. Par exemple, si l’on réalise de la classification de sons correspondant à des phonèmes on utilise un modèle gauche-droite par phonème pour prendre en compte le fait qu’un phonème est un enchaînement particulier de sons (début, milieu, fin) et qu’une inversion dans ces sons ne correspond plus au même phonème.

La classification...

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Mathématiques

(202 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Usage pour la classification et l’étiquetage de séquences

Page
précédenteLes modèles de Markov cachés en pratique

Page
suivante

Conclusions

BIBLIOGRAPHIE

(1) - RABINER (L.R.) - * - . – A tutorial on hidden markov models and selected applications in speech recognition, in : Proceedings of the IEEE, pp. 257-286 (1989).
(2) - HU (J.), LIM (S.G.), BROWN (M.K.) - Writer independent on-line handwriting recognition using an hmm approach - Pattern Recognition 33 (1) 133-147 (2000).
(3) - RABINER (L.), JUANG (B.-H.) - Fundamentals of speech recognition - Prentice-Hall, Inc., Upper Saddle River, NJ, USA (1993).
(4) - BERTSEKAS (D.), NEDIC (A.), OZDAGLAR (A.) - Convex Analysis and Optimization, Athena Scientific optimization and computation series - Athena Scientific (2003).
(5) - BILMES (J.) - Natural statistical models for automatic speech recognition - Ph.D. thesis, U.C. Berkeley, Dept. of EECS, CS Division (1999).
(6) - JUANG (B.-H.), RABINER (L.) - The segmental k-means algorithm for estimating...

DANS NOS BASES DOCUMENTAIRES

ANNEXES

1 Site Internet

1 Site Internet

Liste Wikipedia des outils développés pour la reconnaissance de la parole : http://en.wikipedia.org/wiki/List-of-speech-recognition-software

HAUT DE PAGE

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Mathématiques

(202 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS