Normalisierung des Pegels der Sprachausgabe

peter.ladwig · December 20, 2019, 11:43am

Die Sprachausgabe beim Abhören der aufgesprochenen Sätze schwankt stark und führt dazu, dass Sätze abwechselnd kaum verständlich und dann wieder brüllend laut sind. Die Sätze an sich sind in Varianten nach manueller Lautstärkekorrektur durchaus verständlich Daher rege ich an, die Samples auf einen üblichen Standardpegel zu normalisieren. Auch eine Spracherkennungs-Engine wird die Samples vor der weiteren Verarbeitung auf einen einheitlichen Pegel normalisieren.

Mit freundlichem Gruß
Peter Ladwig

jf99 · December 22, 2019, 12:42pm

Hallo Peter und willkommen im Forum!

Ich stimme dir zu. Selbst mit Kopfhörern mit Lautstärkeregler ist das nervig. Das Problem ist bekannt und kam schon mehrfach zur Diskussion (z. B. #336, #1498) und zwischenzeitlich war es sogar schon gelöst, wurde dann aber wieder aus irgendwelchen Gründen zurückgezogen. Leider ist nicht absehbar, wann es endgültig behoben wird. Webentwickler, die sich hier einbringen wollen, sind willkommen.

peter.ladwig · December 22, 2019, 1:37pm

Hallo Jens,

Danke für die Antwort, die Diskussionen hätte ich natürlich auch finden sollen…

Interessant darin ist eine Antwort, die mir den Weg zu einer für mich ausreichenden Lösung führt:
est31 hat für Firefox das vmo-audio-normalizer Plugin geschrieben.
Trotz (einer) schlechten Bewertung benötigt man nicht mehr die Hand am Lautstärkeregler, sondern kann die Samples unter Linux/Firefox entspannt abhören. Dann noch ein eigenes Profil in Firefox mit dem Plugin und mozilla Common Voice als Startseite und es fluppt ohne gefummel, und das Plugin stört nicht bei normaler Browsernutzung.

stergro · December 22, 2019, 9:22pm

Warum normalisiert man nicht im Backend und speichert die Dateien gleich auf einer einheitlichen Lautstärke für alle Browser? Das erscheint mir sinnvoller und weniger Buganfällig.

jsrobotnics · December 29, 2019, 7:20pm

Das wäre mir auch ein Anliegen. +1

Topic		Replies	Views
Feature Request: Normalize sounds for validation Common Voice feedback	3	1153	December 28, 2018
Normalized samples Common Voice feedback	2	1207	May 6, 2019
:white_check_mark: Vorläufige Richtlinien für das Validieren von Sätzen Deutsch (de)	7	2045	October 3, 2021
Mejoras en la experiencia de la app Español (es)	5	1009	August 28, 2019
No sound audible (or extremely low volume) during validation of sentences Common Voice	1	854	August 26, 2019

Normalisierung des Pegels der Sprachausgabe

Related topics