Gesture-based Articulatory Text to Speech Synthesis

Benjamin Weitz; Ingmar Steiner; Peter Birkholz

Gesture-based Articulatory Text to Speech Synthesis

Publikation: Beitrag in Buch/Konferenzbericht/Sammelband/Gutachten › Beitrag in Konferenzband › Beigetragen › Begutachtung

Beitragende

Benjamin Weitz - , SemVox GmbH, Universität des Saarlandes (Autor:in)
Ingmar Steiner - , Universität des Saarlandes, Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI) (Autor:in)
Peter Birkholz - , Juniorprofessur für Kognitive Systeme (Autor:in)

Abstract

We present work carried out to extend the text to speech (TTS) platform MaryTTS with a back-end that serves as an interface to the articulatory synthesizer VocalTractLab (VTL). New processing modules were developed to (a) convert the linguistic and acoustic parameters predicted from orthographic text into a gestural score, and (b) synthesize it to audio using the VTL software library. We also describe an evaluation of the resulting gesture-based articulatory TTS, using articulatory and acoustic speech data.

Details

Originalsprache	Englisch
Titel	Elektronische Sprachsignalverarbeitung 2017
Redakteure/-innen	Jürgen Trouvain, Ingmar Steiner, Bernd Möbius
Herausgeber (Verlag)	Dresden : TUDpress
Seiten	324-331
Seitenumfang	8
ISBN (Print)	978-3-959080-92-7
Publikationsstatus	Veröffentlicht - 1 März 2017
Peer-Review-Status	Ja

Publikationsreihe

Reihe	Studientexte zur Sprachkommunikation
Band	86
ISSN	0940-6832

Externe IDs

ORCID	/0000-0003-0167-8123/work/168716951

Schlagworte

Schlagwörter

Poster

Forschungsportal der TU Dresden