High Tech

High Tech

Electronique, robotique, Mesures, tests électroniques

Duolingo, ou comment apprendre une langue gratuitement tout en traduisant le Web
02 janv. 2012

Duolingo, ou comment apprendre une langue gratuitement tout en traduisant le Web

Luis Von Ahn, le célèbre co-créateur du Captcha et de reCaptcha, a développé un outil collaboratif d'apprentissage des langues et de traduction, Duolingo, permettant d'apprendre une langue gratuitement tout en traduisant des pages web. Un outil à la fois innovant et très prometteur. Retour sur une évolution limpide, du CAPTCHA à Duolingo.

Luis Von Ahn : ce nom vous est peut-être familier. Si ce n'est pas le cas, il le sera bientôt. Le créateur de l'outil collaboratif d'apprentissage des langues et de traduction du web « Duolingo » n'en est en effet pas à son premier coup de maître. Ce professeur d'informatique de l'université Carnegie-Mellon, à Pittsburgh, en Pennsylvanie, est notamment responsable des fameux CAPTCHA, ainsi que des reCAPTCHA, deux solutions innovantes nous donnant la possibilité de nous distinguer d'un bot ou d'un ordinateur. Duolingo ne se veut pas moins innovant, et a pour vocation de tenir la dragée haute, voire même de supplanter les outils traditionnels d'apprentissage d'une langue étrangère. Tout d'abord parce qu'il est gratuit ; ensuite parce qu'il associe à l'apprentissage de la langue, une fonction et un outil de traduction du web pédagogique et collaboratif.

De CAPTCHA à reCAPTCHA, de reCAPTCHA à Duolingo, l'enchaînement dont voici la genèse est on ne peut plus logique.

La création de CAPTCHA :

Acronyme de « Completely Automated Public Turing test to tell Computers and Humans Apart », le CAPTCHA est une forme de Test de Turing inversé permettant de différencier une intelligence artificielle d’un humain, dont l’algorithme le plus usité donne ces très reconnaissables mots gondolés. Le CAPTCHA a pour vocation première d'empêcher un bot ou un ordinateur de soumettre un formulaire un très grand nombre de fois. Il pourrait aussi permettre, comme nous vous en parlions déjà au mois d'avril dernier ici, de simplifier les mots de passe tout en les rendant plus sûrs.

Le principal problème d'un CAPTCHA est qu'il fait perdre du temps (presque) inutilement, de l'aveu même de son co-créateur Luis Von Ahn. Ce temps, une fois cumulé est gigantesque : environ dix secondes pour chacun des 200 millions de CAPTCHA tapés chaque jour... Près de 560.000 heures par jour...

Une démarche limpide et logique : de CAPTCHA à reCAPTCHA

Conscient de cet état de fait, mais dans l'impossibilité d'enlever les CAPTCHAs sans grever la sécurité des formulaires numériques, il décida de travailler à la bonne utilisation du temps jusqu'ici « perdu », explorant la piste du calcul distribué à l'aide d'humains. Le fruit de ces recherches donnèrent alors naissance au reCAPTCHA, dont la trame se trouve être la même que celle de son aîné. Grosse différence néanmoins : le temps passé devant un CAPTCHA n'est plus perdu puisqu'il permet aussi d'aider à la numérisation des livres. En effet, deux mots vous sont proposés, un dont le système connait déjà la réponse et permettant de vous identifier comme humain, et l'autre issu des nombreux livres en cours de numérisation, mais n'ayant pas réussi à être décrypté par la reconnaissance optique de caractères. Le coup de maître est ici : si une dizaine d'utilisateurs à travers le monde sont authentifiés comme étant humain par le premier CAPTCHA et donnent une réponse identique pour le second, le système peut alors en toute simplicité en déduire que le mot à numériser est bien le bon !

La technique, tenant du crowdsourcing, a depuis largement fait ses preuves, ce qui n'est pas passé inaperçu aux yeux du géant américain Google, qui a acquis la société en septembre 2009, pour affiner le processus de numérisation d'ouvrages amorcé par Google Books.

Création de Duolingo :

Explorant plus loin encore la piste du calcul distribué à l'aide d'humains, Luis Von Ahn et son équipe a voulu mettre au point un outil permettant de rendre le web en le traduisant en toutes les langues majeures. Bien qu'il soit possible d'utiliser un ordinateur pour cette tâche, les traductions ne sont pas au jour d'aujourd'hui suffisamment bonnes. Il reste toujours possible de faire appel à des traducteurs professionnels, mais le temps nécessaire et le prix ont vite semblé complètement rédhibitoires. L'idée d'associer alors l'apprentissage gratuit d'une langue et la traduction d'une page web a donc vu le jour, faisant d'une pierre deux coups. D'après les estimations de Luis Von Ahn, « si un million d'utilisateurs apprennent l'espagnol sur Duolingo, l'intégralité de Wikipedia pourrait être traduit en cette langue en seulement... 80 heures ! ».

Les traductions proposées par les internautes seront évaluées par d'autres internautes apprentis élèves, et lorsqu'une dizaine de personnes en viennent à la même traduction pour une phrase donnée, le système pourra alors estimer qu'il y a une forte probabilité que la traduction soit correcte.

Pour l'heure en phase de développement, Duolingo est disponible en version beta privée. Pour ajouter votre pierre à l'édifice et apprendre ou parfaire par la même occasion votre connaissance d'une langue étrangère (pour le moment, seuls l'espagnol et l'allemand sont disponibles, à partir de l'anglais), inscrivez vous sur http://duolingo.com/#.

 

Par M.R




VOS COMMENTAIRES

Pour publier un commentaire, vous devez être identifié.

Laurent C.

Le concept est génial, j'ai testé pour l'allemand et pour le français (sic). Vivement l'interface en français L'aspect collaboratif est le plus innovant. Si vous voulez voir comment ca marche j'ai fait deux petites video lors de mes essais http://wp.me/p2mzNG-4e
11 juil. 2012