Cet article est la réédition actualisée de l'article du même titre, paru en 2003 et rédigé par Gaël RICHARD et Olivier CAPPÉ.
RECHERCHEZ parmi plus de 10 000 articles de référence ou pratiques et 4 000 articles d'actualité
PAR DOMAINE D'EXPERTISE
PAR SECTEUR INDUSTRIEL
PAR MOTS-CLES
NAVIGUER DANS LA
CARTOGRAPHIE INTERACTIVE
DÉCOUVREZ toute l'actualité, la veille technologique GRATUITE, les études de cas et les événements de chaque secteur de l'industrie.
Article précédent
Format d’image SVGArticle de référence | Réf : H7288 v2
Auteur(s) : Christophe D'ALESSANDRO, Gaël RICHARD
Date de publication : 10 nov. 2013
Cet article fait partie de l’offre
Documents numériques Gestion de contenu (66 articles en ce moment)
Cette offre vous donne accès à :
Une base complète et actualisée d'articles validés par des comités scientifiques
Un service Questions aux experts et des outils pratiques
Des Quiz interactifs pour valider la compréhension et ancrer les connaissances
Présentation
Lire l'article
Bibliographie & annexes
Inclus dans l'offre
Cet article est la réédition actualisée de l'article du même titre, paru en 2003 et rédigé par Gaël RICHARD et Olivier CAPPÉ.
L’objet de cet article est de proposer une vue d’ensemble de la synthèse de la parole à partir du texte (ou TTS, Text-To-Speech en Anglais), le but étant de calculer automatiquement le signal de parole correspondant à un texte donné. Les différentes étapes permettant de réaliser un tel système sont décrites tout en incluant les techniques les plus récentes, dont celles exploitant les modèles de Markov cachés. Les différentes applications de la synthèse vocale ainsi que l’offre des principaux acteurs du domaine sont également discutées.
This article provides an overview of speech synthesis from text or Text-To-Speech (TTS) in order to automatically calculate the speech signal corresponding to a given text. The various stages necessary in order to set up such a system are described, including the latest techniques such as those exploiting hidden Markov models. The various applications of speech synthesis and the principal offers in this domain are also discussed.
Christophe D'ALESSANDRO : Directeur de Recherches LIMSI-CNRS, Orsay, France
Gaël RICHARD : Professeur Institut Mines-Télécom, Télécom ParisTech, CNRS-LTCI, Paris, France -
L'objet de la synthèse de la parole à partir du texte (ou TTS, Text-To-Speech) est de calculer automatiquement le signal de parole correspondant à un texte donné. Le texte lui-même peut provenir de diverses sources : journaux, livres, systèmes de réponse vocale, de dialogue ou traduction automatique (borne interactive, assistant personnel), base de données d'un système d'information, jeu vidéo, courriers électroniques, SMS, documents butinés sur la toile, ou tout simplement texte saisi au clavier d'un ordinateur.
La réponse vocale sous sa forme la plus simple peut être un ensemble de messages préenregistrés (ou « prompts »). L'ambition de la synthèse de la parole à partir du texte est plus grande : il s'agit de calculer automatiquement les échantillons sonores correspondant à un énoncé écrit quelconque, qui n'est pas connu d'avance et qui peut être de grande taille.
Les deux versants de la synthèse de la parole sont d'une part, l'analyse et l'interprétation du texte, d'autre part, la prédiction des paramètres acoustico- phonétiques du son et la synthèse du signal proprement dite :
Analyse du texte : la première étape de la transformation d'un texte en parole implique la capacité d'analyser, de comprendre le texte écrit, ses nuances et ses connotations, la situation du discours et l'acte de parole à effectuer. En plus du texte, le contexte peut être spécifié (style de parole, émotion, attitude, type de personnage, voix spécifique...) ;
Synthèse du signal : une fois le texte analysé, il s'agit de calculer le signal acoustique qui interprète au mieux le contenu linguistique, avec une voix aussi naturelle que possible, ressemblant à un locuteur particulier, et avec les nuances d'attitude, voire d'émotion que le texte réclame. En plus du signal audio, le synthétiseur peut fournir des indications pour synchroniser le mouvement des lèvres d'un avatar ou personnage vidéo, ou les mouvements d'un robot.
signal processing | linguistics
Vous êtes abonné à cette offre ?
Connectez-vous !
Vous souhaitez découvrir cette offre ?
Cet article est inclus dans l'offre :
DOCUMENTS NUMÉRIQUES GESTION DE CONTENU
(1) - SPROAT (R.), MOEBIUS (B.), MAEDA (K.), TZOUKERMANN (E.) - Multilingual text analysis. - Dans Multilingual Text-To-Speech Synthesis – The Bell Labs Approach, SPROAT (R.) et coll. éd., Kluwer Academic Publishers (1998). Ce livre décrit en détail les procédures de synthèse de l'anglais et d'autres langues, et donne une introduction au domaine.
(2) - TAYLOR (P.) - Text-To-Speech synthesis. - Paul Taylor, Cambridge University Press (2009). Ce livre récent présente de façon approfondie les techniques de synthèse modernes.
(3) - HARDCASTLE (W.T.), MARCHAL (A.) - Speech Production and Speech Modeling. - Kluwer Academic Publishers (1990). Ce livre est une introduction à la production de la parole par l'humain.
(4) - BOËFFARD (O.), D'ALESSANDRO (C.) - Synthèse de la parole. - Dans « Analyse, synthèse et codage de la parole », sous la direction de MARIANI (J.), Hermès (2002). Ce livre est une excellente introduction au traitement de la parole, existe aussi en anglais.
(5) - D'ALESSANDRO (C.), TZOUKERMANN (E.) - Synthèse...
Acapela http://www.acapela-group.com/
Acapela est le nouveau nom du groupe issu de BaBel Technologies SA et Babel-Infovox AB, qui a également absorbé ELAN speech. Acapela propose de nombreuses solutions de synthèse multilingues issues au départ des recherches de l'Institut royal de technologie de Stockholm (KTH) et l'Université de Mons (Belgique). Les technologies proposées par Acapela incluent la synthèse à formants, la synthèse par diphones (technologie MBROLA) et la synthèse par sélection/concaténation. La synthèse paramétrique statistique n'est pas encore commercialisée, mais pourrait bientôt apparaître sur le marché. Acapela offre des produits en 18 langues, et affiche plus de 1 000 clients industriels dans des domaines très variés.
L'offre d'Acapela se décline suivant quatre grands axes :
1. Le développement d'applications de synthèse :
a. kits de développement logiciels (SDK, Software Development Kits) proposés pour la plupart pour des systèmes d'exploitation, sous la forme serveur, ordinateur personnel ou système mobile (Linux, Windows, Mac OS X, Androïd, etc.), pour des systèmes à la demande ou pour des services Internet,
b. systèmes de réponse vocale matériel, pour la synthèse par exemple de messages de sécurité dans des environnements industriels (Hardware Speech Unit ),
c. systèmes de lecture vocale pour les journaux ou autres éditeurs,
d. systèmes de personnalisation vocale des services, pour des compagnies souhaitant donner une identité vocale à leur site ou produits,
e. des...
Vous êtes abonné à cette offre ?
Connectez-vous !
Vous souhaitez découvrir cette offre ?
Cet article est inclus dans l'offre :
DOCUMENTS NUMÉRIQUES GESTION DE CONTENU
DÉTAIL DE L'ABONNEMENT :
TOUS LES ARTICLES DE VOTRE RESSOURCE DOCUMENTAIRE
Accès aux :
Articles et leurs mises à jour
Nouveautés
Archives
Articles interactifs
Formats :
HTML illimité
Versions PDF
Site responsive (mobile)
Info parution :
Toutes les nouveautés de vos ressources documentaires par email
DES ARTICLES INTERACTIFS
Articles enrichis de quiz :
Expérience de lecture améliorée
Quiz attractifs, stimulants et variés
Compréhension et ancrage mémoriel assurés
DES SERVICES ET OUTILS PRATIQUES
Votre site est 100% responsive,
compatible PC, mobiles et tablettes.
FORMULES
Formule monoposte | Autres formules | |
---|---|---|
Ressources documentaires | ||
Consultation HTML des articles | Illimitée | Illimitée |
Quiz d'entraînement | Illimités | Illimités |
Téléchargement des versions PDF | 5 / jour | Selon devis |
Accès aux archives | Oui | Oui |
Info parution | Oui | Oui |
Services inclus | ||
Questions aux experts (1) | 4 / an | Jusqu'à 12 par an |
Articles Découverte | 5 / an | Jusqu'à 7 par an |
Dictionnaire technique multilingue | Oui | Oui |
(1) Non disponible pour les lycées, les établissements d’enseignement supérieur et autres organismes de formation. |
||
Formule 12 mois 995 € HT |
Autres formules |
INTRODUCTION
1 - HISTOIRE DE LA SYNTHÈSE DE LA PAROLE
2 - ANALYSES ET TRAITEMENTS LINGUISTIQUES
3 - SIGNAL DE PAROLE ET MODÈLE SOURCE-FILTRE
6 - APPLICATIONS DE LA SYNTHÈSE DE PAROLE
Information
Quiz d'entraînement bientôt disponible
TECHNIQUES DE L'INGENIEUR
L'EXPERTISE TECHNIQUE ET SCIENTIFIQUE
DE RÉFÉRENCE
ÉDITION - FORMATION - CONSEIL :
Avec Techniques de l'Ingénieur, retrouvez tous les articles scientifiques et techniques : base de données, veille technologique, documentation et expertise technique
LOGICIELS
Automatique - Robotique | Biomédical - Pharma | Construction et travaux publics | Électronique - Photonique | Énergies | Environnement - Sécurité | Génie industriel | Ingénierie des transports | Innovation | Matériaux | Mécanique | Mesures - Analyses | Procédés chimie - bio - agro | Sciences fondamentales | Technologies de l'information
ACCUEIL | A PROPOS | EXPERTS SCIENTIFIQUES | NOUS REJOINDRE | PUBLICITÉ | PLAN DU SITE | CGU | CGV | MENTIONS LÉGALES | RGPD | COOKIES | AIDE | FAQ | NOUS CONTACTER
PAIEMENT
SÉCURISÉ
OUVERTURE RAPIDE
DE VOS DROITS
ASSISTANCE TÉLÉPHONIQUE
+33 (0)1 53 35 20 20