An alle 'Specher': Kontrolle?

Hallo, mal aus gegebenem Anlass an alle Sprecher von Texten (ich kontrolliere gerade ziemlich viele Hörproben):

Es gibt die Möglichkeit, den eigenen Text mal zur Kontrolle anzuhören. Ja, tatsächlich.

Habt ihr, liebe Sprecher - das auch schon gesehen? Ja?

Dann darf ich bitten: hört euch eueren eigenen Text doch mal an. Manchmal ist es einfach nur: Nebengeräusche, klopfen auf dem Touchpad, eine verschluckte Silbe, oder eine vergessene Endung-‘s’ oder Plural-‘e’. Oder der Laptop/PC schafft es nicht, den Stream vom Mikrofon zu digitalisieren, dann ist der Text ver-knackst oder dupliziert. Das würde bei der Gegenkontrolle euch doch sicherlich selber auffallen.

Manchmal ist es aber auch einfach so, dass ihr Wörter lest oder umdeutet, die einfach so nicht in dem vorgegebenen Text drinstehen. Das verstehe ich nicht, dass ihr sowas überhaupt hochladet. Es geht doch nicht darum, wie ihr, liebe Vorleser, einen Text vielleicht gerne hättet das es lauten würde!? Sondern es geht darum, genau die Worte zu lesen, die da vorgegeben wurden (so ‘blöd’ sie einem, auch mir, manchmal auch vorkommen mögen).

Wenn der Text grammatikalisch falsch ist, oder Abkürzungen enthält, kann man das ja mit einem Button “melden”, wenn es zu schwierig (!) ist, kann man auch mal auf “weiter” klicken.

Aber was ich hier manchmal zu hören bekomme: unglaublich - falsch.

Mal ganz abgesehen davon, dass wir hier kein Schnell-Sprech-Wettbewerb haben. Wenn ich als Mensch einen maschinengewehr-schnell gesprochenen Satz einfach nicht verstehe, weil es total ins Nuscheln übergeht, dann weise ich den Text zurück als Kontrollhörer, so einfach ist das. Schade um die Arbeitszeit, sage ich da nur.

So, das musste mal (als Hör-Kontroller) gesagt werden (alleine, wie viele der hier Mitwirkenden werden das wohl lesen?)

M

2 Likes

Das ist leider völlig normal. Beim Lesen wendet das Gehirn auch eine Art Mustererkennung an und rät eben manchmal falsch. Beim normalen lesen merkt man das in der Regel, weil der Kontext dann nicht mehr stimmt. Bei den hier thematisch wild zusammengewürfelten Einzelsätzen funktioniert dieser Korrekturmechanismus des Gehirns leider nicht. Genau deswegen muss gegengeprüft werden. Dritten fallen solche Fehler in der Regel immer auf, einem selbst nicht, weil das eigene Gehirn von sich natürlich überzeugt ist, dass es alles richtig gemacht bzw. erkannt hat :slight_smile:

Das mit den Endungen ist so eine Sache. Bei mir haben sich im natürlichen Spargebrauch die Endungen “abgeschliffen”. anstatt “weiterzuführen” wird daraus beim Sprechen ein “weiterzuführn”. Bei manchen norddeutschen Kollegen klingt dass beim Sprechen eher wie eine “weiterzuführän”. Das sind meiner Meinung nach beides Fälle, die eine Kontrolle ohne Beanstandung passieren sollten. Das fällt meines Erachtens ganz klar unter natürliche Sprache. Ich würde es nämlich gut finden, wenn die Spracherkennung später auch mit meinen abgeschliffenen Endungen umgehen kann :slight_smile:

Bei fehlenden Endungen bin ich aber vollkommen bei dir. Zwischen fehlenden Endungen und abgeschliffenen Endungen gibt es aber sicher einen Graubereich, der nur Individuell (von Fall zu Fall) beurteilt werden kann. Deswegen das Vier-Augen- ääh Vier- bzw. Sechs-Ohren-Prinzip …

1 Like

Hallo :slight_smile:
ich bin noch nicht so lange dabei, aber hatte es bisher so verstanden, dass Nebengeräusche/Hintergrundgeräusche sogar explizit erwünscht sind, solange der gesprochene Text zu verstehen ist. Eine Spracherkennung sollte am Ende doch auch Sprache erkennen, obwohl Hintergrundgeräusche dabei sind.

In der FAQ habe ich dazu Folgendes gefunden (https://voice.mozilla.org/de/faq):

Wir möchten, dass der Common-Voice-Datensatz die Audioqualität widerspiegelt, die eine Sprach-zu-Text-Engine in der freien Natur hört. Wir suchen also nach Abwechslung. Zusätzlich zu einer vielfältigen Gemeinschaft von Sprechern wird ein Datensatz mit unterschiedlicher Audioqualität die Sprach-zu-Text-Engine in die Lage versetzen, mit verschiedenen Situationen der realen Welt umzugehen, vom Hintergrundgespräch bis zum Autolärm. Solange Ihr Sprachclip verständlich ist, sollte er für den Datensatz gut genug sein.

Vielleicht verstehe ich das aber auch falsch :man_shrugging:

Viele Grüße

2 Likes

Das ist in der Tat eine gute Empfehlung. So kann man selbst überprüfen, ob man zu leise oder völlig übersteuert ist.

Ich muss aber auch mal ein Kompliment an die vielen guten Sprecher loswerden. Bei vielen Hörproben macht es mir wirklich Spaß zuzuhören, weil sie sehr gut gesprochen sind. Tolle Betonung, schöne Satzmelodie oder einfach eine angenehme Stimme …

Gruß

1 Like