Optimierung der Numerik eines linearen Gleichungssystems für die Simulation des Schallfeldes im Vokaltrakt

Research output: Contribution to book/Conference proceedings/Anthology/ReportConference contributionContributedpeer-review

Abstract

Im Gegensatz zur in Forschung und Industrie weit verbreiteten konkatenativen Sprachsynthese besitzt die artikulatorische Sprachsynthese alle Freiheiten, die auch ein natürlicher Sprechapparat besitzt. Durch die vollständige aeroakustische Simulation der Sprache entsteht nachteilig ein hoher Rechenaufwand. Maßgeblich ist die Berechnung eines großen linearen Gleichungssystems (LGS) zur Simulation des Schallfeldes im Vokaltrakt. Um die Berechnungszeit zu reduzieren wurden für den artikulatorischen Sprachsynthesizer VocalTractLab verschiedene numerische Verfahren, Vorkonditionierungen und Speicherstrategien untersucht. Insgesamt ist es gelungen, mittels der Cholesky-Zerlegung und einer auf den Algorithmus sowie auf das LGS angepassten Speichermethode die Berechnungszeit um das Fünf- bis Sechsfache gegenüber dem bisher verwendeten Gauß-Seidel-Relaxationsverfahren zu verkürzen. Verglichen mit der Dauer des simulierten akustischen Signals nimmt die Berechnung des LGS nur noch ca. die Hälfte der simulierten Zeit in Anspruch - womit die gesamte Synthese deutlich näher an die Echtzeitfähigkeit rückt und auf aktueller PC-Hardware einen Echtzeitfaktor von 2 erreicht (vgl. vorher 4,5).

Details

Original languageGerman
Title of host publicationElektronische Sprachsignalverarbeitung 2018
EditorsAndré Berton, Udo Haiber, Wolfgang Minker
Publisher Dresden : TUDpress
Pages359-366
Number of pages8
ISBN (print)978-3-959081-28-3
Publication statusPublished - 1 Mar 2018
Peer-reviewedYes

Publication series

SeriesStudientexte zur Sprachkommunikation
Volume90
ISSN0940-6832

External IDs

ORCID /0000-0003-0167-8123/work/168716955

Keywords

Keywords

  • Speech Synthesis