Normalisierung des Pegels der Sprachausgabe

Die Sprachausgabe beim Abhören der aufgesprochenen Sätze schwankt stark und führt dazu, dass Sätze abwechselnd kaum verständlich und dann wieder brüllend laut sind. Die Sätze an sich sind in Varianten nach manueller Lautstärkekorrektur durchaus verständlich Daher rege ich an, die Samples auf einen üblichen Standardpegel zu normalisieren. Auch eine Spracherkennungs-Engine wird die Samples vor der weiteren Verarbeitung auf einen einheitlichen Pegel normalisieren.

Mit freundlichem Gruß
Peter Ladwig

2 Likes

Hallo Peter und willkommen im Forum!

Ich stimme dir zu. Selbst mit Kopfhörern mit Lautstärkeregler ist das nervig. Das Problem ist bekannt und kam schon mehrfach zur Diskussion (z. B. #336, #1498) und zwischenzeitlich war es sogar schon gelöst, wurde dann aber wieder aus irgendwelchen Gründen zurückgezogen. Leider ist nicht absehbar, wann es endgültig behoben wird. Webentwickler, die sich hier einbringen wollen, sind willkommen.

1 Like

Hallo Jens,

Danke für die Antwort, die Diskussionen hätte ich natürlich auch finden sollen…

Interessant darin ist eine Antwort, die mir den Weg zu einer für mich ausreichenden Lösung führt:
est31 hat für Firefox das vmo-audio-normalizer Plugin geschrieben.
Trotz (einer) schlechten Bewertung benötigt man nicht mehr die Hand am Lautstärkeregler, sondern kann die Samples unter Linux/Firefox entspannt abhören. Dann noch ein eigenes Profil in Firefox mit dem Plugin und mozilla Common Voice als Startseite und es fluppt ohne gefummel, und das Plugin stört nicht bei normaler Browsernutzung.

Warum normalisiert man nicht im Backend und speichert die Dateien gleich auf einer einheitlichen Lautstärke für alle Browser? Das erscheint mir sinnvoller und weniger Buganfällig.

Das wäre mir auch ein Anliegen. +1