Méthodes à noyau parcimonieuses
Machines à noyaux pour l’apprentissage statistique
TE5255 v1 Article de référence

Méthodes à noyau parcimonieuses
Machines à noyaux pour l’apprentissage statistique

Auteur(s) : Stéphane CANU

Date de publication : 10 févr. 2007 | Read in English

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

Présentation

1 - Contexte

2 - Noyaux et reconnaissance des formes

3 - Outils

4 - Méthodes à noyau non parcimonieuses

  • 4.1 - Splines d’interpolation
  • 4.2 - Splines de lissage
  • 4.3 - Régression logistique à noyau
  • 4.4 - Considérations algorithmiques

5 - Méthodes à noyau parcimonieuses

6 - Aspects pratiques liés à la mise en œuvre des machines à noyaux

  • 6.1 - Noyau et optimisation
  • 6.2 - Réglage des hyperparamètres pour la sélection de modèle
  • 6.3 - Différentes phases de la mise en œuvre

7 - Conclusion

Sommaire

Présentation

RÉSUMÉ

Les machines à noyaux constituent une classe d’algorithmes permettant d’extraire de l’information à partir de données dans un cadre non paramétrique. L’intérêt suscité par ces méthodes tient d’abord aux excellentes performances qu’elles ont permis d’obtenir notamment sur les problèmes de grande taille. Cette bonne tenue à la charge est due à la parcimonie de la solution et à la faible complexité de son calcul. L’intérêt des machines à noyaux réside aussi dans leur caractère flexible et rigoureux, approche, qui recèle un grand potentiel. Cet article vise à introduire les machines à noyaux en se focalisant sur la plus populaire, le séparateur à vaste marge.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

  • Stéphane CANU : Professeur des Universités - Directeur du LITIS, INSA de Rouen

INTRODUCTION

Les machines à noyaux constituent une classe d’algorithmes permettant d’extraire de l’information à partir de données dans un cadre non paramétrique. L’intérêt suscité par ces méthodes tient d’abord aux excellentes performances qu’elles ont permis d’obtenir notamment sur les problèmes de grande taille. Cette bonne tenue à la charge est due à la parcimonie de la solution et à la faible complexité de son calcul. L’intérêt des machines à noyaux réside aussi dans leur caractère flexible et rigoureux, approche, qui recèle un grand potentiel. Ce dossier vise à introduire les machines à noyaux en se focalisant sur la plus populaire, le séparateur à vaste marge (SVM), en faisant le point sur les différentes facettes de son utilisation. L’accent est mis sur les considérations pratiques liées à la mise en œuvre de ce type de méthode.

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 93 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-te5255

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

5. Méthodes à noyau parcimonieuses

Il existe différentes manières d’introduire la parcimonie. Il est notamment toujours possible d’imposer directement à la solution de ne dépendre que d’un petit nombre de coefficients non nuls. Mais il est plus élégant de formuler des critères à minimiser de sorte que la solution soit naturellement parcimonieuse. C’est le cas des séparateurs à vaste marges (SVM ou support vector machines) que nous allons voir maintenant.

Dans le cadre des SVM, on cherche dans un EHNR H de noyau k la fonction de norme minimale discriminant au mieux un ensemble d’observations de deux classes (x iy i ) i = 1, n avec y i { 1,1} . La fonction de décision D est de la forme suivante D (x) = signe (f (x) + α 0). Lorsqu’un exemple est bien classé, il vérifie l’inégalité y i ( f( x i )+ α 0 )0 . La marge d’une fonction de discrimination est alors définie sur un ensemble (x iy i ), i = 1, n de points biens classés comme la plus petite distance entre les points de l’échantillon et la frontière de décision soit : min i y i (f (x i ) + α 0). Il se trouve que pour le problème de discrimination, la marge est directement liée à la confiance que l’on peut accorder à une fonction de discrimination. Il est alors raisonnable de rechercher la fonction de décision qui maximisera cette marge m tout en...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 95 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Lecture en cours
Méthodes à noyau parcimonieuses

Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - VAPNIK (V.) -   Statistical Learning Theory  -  . Wiley, 1998.

  • (2) - HASTIE (T.), TIBSHIRANI (R.), FRIEDMAN (J.) -   The elements of statistical learning  -  . Data Mining, inference and predictions, Springer, 2001.

  • (3) - HERBRICH (R.) -   Learning Kernel Classifiers  -  . The MIT Press, 2002.

  • (4) - SCHOELKOPF (B.), SMOLA (A.J.) -   Learning with Kernels  -  . The MIT Press, 2002.

  • (5) - SHAWE-TAYLOR (J.), CRISTIANIN (N.) -   Kernel Methods for Pattern Analysis  -  . Cambridge Univ. Press, 2004.

  • (6) -   *  -  Trois sites de référence : http://www.kernel-machines.org, http://jmlr.csail.mit.edu, http://www.nips.cc.

  • (7)...

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 92 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Technologies logicielles Architectures des systèmes"

(236 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Modèles de Markov cachés pour l’étiquetage de séquences

Les modèles markoviens cachés sont un outil essentiel pour le traitement, l’exploration, la ...

Visualisation d'information

Les traces de l'activité du monde socio-économique sont l'objet d'analyse de toutes sortes pour mesurer ...

La fusion multipistes

Au sein des systèmes de surveillance multisenseurs, la fusion multipistes a pour objectif d'éviter la ...