Gesture-based Articulatory Text to Speech Synthesis

Publikation: Beitrag in Buch/Konferenzbericht/Sammelband/GutachtenBeitrag in KonferenzbandBeigetragenBegutachtung

Beitragende

  • Benjamin Weitz - , SemVox GmbH, Universität des Saarlandes (Autor:in)
  • Ingmar Steiner - , Universität des Saarlandes, Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI) (Autor:in)
  • Peter Birkholz - , Juniorprofessur für Kognitive Systeme (Autor:in)

Abstract

We present work carried out to extend the text to speech (TTS) platform MaryTTS with a back-end that serves as an interface to the articulatory synthesizer VocalTractLab (VTL). New processing modules were developed to (a) convert the linguistic and acoustic parameters predicted from orthographic text into a gestural score, and (b) synthesize it to audio using the VTL software library. We also describe an evaluation of the resulting gesture-based articulatory TTS, using articulatory and acoustic speech data.

Details

OriginalspracheEnglisch
TitelElektronische Sprachsignalverarbeitung 2017
Redakteure/-innenJürgen Trouvain, Ingmar Steiner, Bernd Möbius
Herausgeber (Verlag) Dresden : TUDpress
Seiten324-331
Seitenumfang8
ISBN (Print)978-3-959080-92-7
PublikationsstatusVeröffentlicht - 1 März 2017
Peer-Review-StatusJa

Publikationsreihe

ReiheStudientexte zur Sprachkommunikation
Band86
ISSN0940-6832

Externe IDs

ORCID /0000-0003-0167-8123/work/168716951

Schlagworte

Schlagwörter

  • Poster