Optimierung der Numerik eines linearen Gleichungssystems für die Simulation des Schallfeldes im Vokaltrakt

Publikation: Beitrag in Buch/Konferenzbericht/Sammelband/GutachtenBeitrag in KonferenzbandBeigetragenBegutachtung

Abstract

Im Gegensatz zur in Forschung und Industrie weit verbreiteten konkatenativen Sprachsynthese besitzt die artikulatorische Sprachsynthese alle Freiheiten, die auch ein natürlicher Sprechapparat besitzt. Durch die vollständige aeroakustische Simulation der Sprache entsteht nachteilig ein hoher Rechenaufwand. Maßgeblich ist die Berechnung eines großen linearen Gleichungssystems (LGS) zur Simulation des Schallfeldes im Vokaltrakt. Um die Berechnungszeit zu reduzieren wurden für den artikulatorischen Sprachsynthesizer VocalTractLab verschiedene numerische Verfahren, Vorkonditionierungen und Speicherstrategien untersucht. Insgesamt ist es gelungen, mittels der Cholesky-Zerlegung und einer auf den Algorithmus sowie auf das LGS angepassten Speichermethode die Berechnungszeit um das Fünf- bis Sechsfache gegenüber dem bisher verwendeten Gauß-Seidel-Relaxationsverfahren zu verkürzen. Verglichen mit der Dauer des simulierten akustischen Signals nimmt die Berechnung des LGS nur noch ca. die Hälfte der simulierten Zeit in Anspruch - womit die gesamte Synthese deutlich näher an die Echtzeitfähigkeit rückt und auf aktueller PC-Hardware einen Echtzeitfaktor von 2 erreicht (vgl. vorher 4,5).

Details

OriginalspracheDeutsch
TitelElektronische Sprachsignalverarbeitung 2018
Redakteure/-innenAndré Berton, Udo Haiber, Wolfgang Minker
Herausgeber (Verlag) Dresden : TUDpress
Seiten359-366
Seitenumfang8
ISBN (Print)978-3-959081-28-3
PublikationsstatusVeröffentlicht - 1 März 2018
Peer-Review-StatusJa

Publikationsreihe

ReiheStudientexte zur Sprachkommunikation
Band90
ISSN0940-6832

Externe IDs

ORCID /0000-0003-0167-8123/work/168716955

Schlagworte

Schlagwörter

  • Speech Synthesis