1.1 - Illustration d’une application des MMC
1.2 - Applications emblématiques
1.3 - Modélisation par des modèles à états

2 - CHAÎNES DE MARKOV ET AUTOMATES PROBABILISTES À ÉTATS FINIS

2.1 - Chaînes de Markov
2.2 - Illustration
2.3 - Durée de séjour dans un état
2.4 - Estimation et inférence

3 - MODÈLES DE MARKOV CACHÉS : LA THÉORIE

3.1 - Définition et principe
3.2 - Calcul de la vraisemblance d’une séquence observée
3.3 - Inférence du chemin optimal pour une séquence observée
3.4 - Estimation des paramètres à partir d’un corpus d’apprentissage
3.5 - Extension des modèles markoviens cachés

4 - LES MODÈLES DE MARKOV CACHÉS EN PRATIQUE

4.1 - Prétraitements et extraction de caractéristiques
4.2 - Initialisation
4.3 - Estimation de probabilités de transitions sur corpus et pondération a posteriori
4.4 - Implémentation

5 - USAGE POUR LA CLASSIFICATION ET L’ÉTIQUETAGE DE SÉQUENCES

5.1 - Usage pour la classification de séquences
5.2 - Critères d’apprentissage discriminants
5.3 - Usage pour l’étiquetage/segmentation de séquences
5.4 - Apprentissage de modèles d’unités élémentaires pour la segmentation
5.5 - Modèles de Markov cachés et traitement du langage

6 - CONCLUSIONS

Bibliographie & annexes

Article de référence | Réf : AF615 v1

Les modèles de Markov cachés en pratique
Modèles de Markov cachés pour l’étiquetage de séquences

Auteur(s) : Thierry ARTIÈRES

Date de publication : 10 avr. 2013

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Présentation

RÉSUMÉ

Les modèles markoviens cachés sont un outil essentiel pour le traitement, l’exploration, la classification, l’étiquetage, le clustering de données séquentielles et de signaux complexes. Ils ont été intensivement utilisés pour des tâches liées au traitement de signaux et séquences véhiculant un message linguistique tels que le signal de parole, le signal d’écriture, le texte. Ils ont été également utilisés pour traiter divers autres types de signaux en bio-informatique, de séquences de navigation et d’interaction homme-machine, etc.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

ABSTRACT

Hidden Markov models for sequence labeling

Hidden Markov models are an essential tool for the treatment, exploration, classification, labeling and clustering of sequential data and complex signals. They have been intensively used for tasks linked to the processing of signals and sequences conveying a linguistic message such as speech signal, write signal or text. They have also been used to process various types of other signals in bio-computing, navigation sequences and man-machine interaction.

Auteur(s)

Thierry ARTIÈRES : Professeur d’informatique - Laboratoire d’informatique de Paris 6 (LIP6) - Université Pierre et Marie Curie (UPMC)

INTRODUCTION

Les modèles markoviens sont une famille de modèles statistiques pour le traitement, l’analyse, la classification de données structurées. Cet article est focalisé sur une instance de ces modèles, les modèles markoviens cachés (MMC), qui ont été et restent très utilisés dans des domaines de classification et d’étiquetage de séquences et de signaux complexes. Ils ont été intensivement utilisés pour des tâches liées au traitement de signaux et séquences véhiculant un message linguistique tels que le signal de parole , le signal d’écriture , le texte. Ils ont été également utilisés pour traiter divers autres types de signaux en bio-informatique, de séquences de navigation et d’interaction homme-machine, etc.

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-af615

Cet article fait partie de l’offre

Mathématiques

(202 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

Page
suivante

Usage pour la classification et l’étiquetage de séquences

4. Les modèles de Markov cachés en pratique

4.1 Prétraitements et extraction de caractéristiques

Quelles que soient les données ou signaux que l’on souhaite exploiter avec des modèles de Markov cachés il faut tout d’abord mettre en forme ces données. Ces prétraitements et cette extraction de caractéristiques peuvent être assez complexes et bénéficier d’une connaissance a priori forte sur les signaux, comme c’est le cas en reconnaissance automatique de la parole.

Par exemple la figure 12 montre le processus par lequel on prétraite un signal d’écriture pour le mettre en forme en entrée d’un système markovien. L’image du mot (ou de la phrase) est découpée en petites fenêtres en faisant glisser une fenêtre étroite de la gauche vers la droite. Pour chaque position de la fenêtre, on calcule un certain nombre de caractéristiques. Par exemple on peut diviser la fenêtre en six parties et calculer la densité de pixels noirs dans chacune des parties, ce qui donne un vecteur réel à six composantes. Le mot peut alors être représenté par la séquence des vecteurs de caractéristiques correspondant à une fenêtre d’analyse glissant de la gauche de l’image vers la droite.

Au final, quel que soit le signal sur lequel on travaille, il doit être prétraité sous forme d’une séquence de vecteurs de caractéristiques pour être exploité par des modèles de Markov cachés tels que ceux décrits dans cet article.

HAUT DE PAGE

4.2 Initialisation

Comme nous l’avons vu l’apprentissage de modèles markoviens cachés est réalisée par l’optimisation d’un critère. Qu’il s’agisse du critère de vraisemblance ou d’un critère discriminant, lorsque les données d’apprentissage ne sont que partiellement étiquetées comme c’est le cas généralement, l’apprentissage est un problème d’optimisation non convexe pour lequel aucun algorithme ne peut garantir une convergence vers un optimum global. L’initialisation est donc une étape essentielle de l’apprentissage.

On distingue généralement deux cas suivant la topologie du modèle que l’on souhaite apprendre. Nous détaillons cette procédure pour les deux topologies les plus répandues :...

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Mathématiques

(202 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Les modèles de Markov cachés en pratique

Page
précédenteModèles de Markov cachés : la théorie

Page
suivante

Usage pour la classification et l’étiquetage de séquences

BIBLIOGRAPHIE

(1) - RABINER (L.R.) - * - . – A tutorial on hidden markov models and selected applications in speech recognition, in : Proceedings of the IEEE, pp. 257-286 (1989).
(2) - HU (J.), LIM (S.G.), BROWN (M.K.) - Writer independent on-line handwriting recognition using an hmm approach - Pattern Recognition 33 (1) 133-147 (2000).
(3) - RABINER (L.), JUANG (B.-H.) - Fundamentals of speech recognition - Prentice-Hall, Inc., Upper Saddle River, NJ, USA (1993).
(4) - BERTSEKAS (D.), NEDIC (A.), OZDAGLAR (A.) - Convex Analysis and Optimization, Athena Scientific optimization and computation series - Athena Scientific (2003).
(5) - BILMES (J.) - Natural statistical models for automatic speech recognition - Ph.D. thesis, U.C. Berkeley, Dept. of EECS, CS Division (1999).
(6) - JUANG (B.-H.), RABINER (L.) - The segmental k-means algorithm for estimating...

DANS NOS BASES DOCUMENTAIRES

ANNEXES

1 Site Internet

1 Site Internet

Liste Wikipedia des outils développés pour la reconnaissance de la parole : http://en.wikipedia.org/wiki/List-of-speech-recognition-software

HAUT DE PAGE

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Mathématiques

(202 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS