Saboteure unter uns!

Hallo, Mod oder Admin. Bitte folgenden Sachverhalt im Auge behalten:
Ich hatte es heute (So, 22-3) mehrmals, daß, statt gesprochener Text, nur eine Musik eingespielt war, und zwar laut und deutlich, so dass ich davon ausgehe, dass dies als Sabotage oder als (entschuldigung) Verarsche dieser mozilla-Seite gemeint ist (sein könnte).

Ich kann ja nicht nachprüfen, ob dies immer vom selben User kommt, aber zumindest 2x war es eindeutig von “Carlos Santana”.

Bitte also im Auge zu behalten. Wenn mich einer der Admins (oder wie man es hier nennt) mit PM anschreibt, dann habe ich auch ein Satzbeispiel für die “Musikaufnahme”.

Gruss
FB

Nachtrag: Mittlerweile 11 Beispiele für “Musik statt Sprache” , Frechheit

Das gibt es leider immer wieder. In anderen Sprachen wurde schon massenweise Elefanten-Tröten gespendet und ich finde immer wieder Leute, die Sätze konsequent ein wenig falsch Einsprechen, z.B. ein Wort verändern. Ich weiß dann nie, ob das Trolle oder Legastheniker sind, aber es gibt Leute, die keinen einzigen Satz richtig aufnehmen. Ich hoffe, dass ein Großteil dieser Sätze bei der Validierung herausgefiltert wird und hoffentlich gibt es bei der Validierung von Sätzen keine Trolle, die dort auf den falschen Knopf drücken. Das wäre viel schwerer herauszufinden. Ich denke aber die Situation wird einfacher, sobald wir ein gute neuronales Netzwerk trainiert haben, damit kann man ungewöhnliche Sätze automatisch herausfiltern und muss nur diese Sätze dann noch mal manuell prüfen.

Wie hast Du heraus gefunden wer der Spender war?

Eine Frage noch: ich hatte Neulich eine Aufnahme in der zwei Personen in Chor den Satz vorgesungen haben. Es war gut verständlich, deswegen habe ich auf Ja gedrückt. Ist das in Ordnung?

Nein, ich weiss natürlich nicht, wer der Ersteller eines Textes (hier: eigentlich der Musik-Einspielungen) war, das kann ich nicht sehen. Meine Idee war, dass das ein Admin (oder so) aber rausfinden kann. Ich melde diese Fakes über den entspr Button, und mehr geht nicht.

Zu Deiner Frage: wenn der Text sehr synchron gesprochen ist - warum nicht?

Hi Ihr beiden,
Danke fürs Kontrollieren. Ich tippe mal, du meintest mit Carlos Santana die Hintergrundmusik :slight_smile:

Hier mal kurz die technische Perspektive. Generell sollte das Inputmaterial so sein, wie später auch das erkannte. Wenn man also Chöre erkennen will, ist das als Input gut, sonst eher so lala. Aber es kommt immer auf die Masse an. Wenn 1% als Chor gesungen wird, ist das nicht weiter schlimm, bei 5% naja. Denn der Input wird dann per Signal in Zahlen zerlegt und zwei Stimmen ergeben einfach ein ganz anderes Inputsignal als eine und daher ist dann auch der Output ein anderer. Zwar ähnlich, aber nicht gleich. Andererseits wird das eher zusätzlich erlernt und macht nicht direkt alles andere zunichte.

Und was die Fakes angeht, auch in anderem Inputmaterial (Untertitel, Reden, Bücher) ist leider immer ein substantieller Teil an Fehlern dabei. Ich kann die Stunden schon nicht mehr zählen, die ich mit dem Bereinigen von Daten verbracht habe :slight_smile: Gehört bei KI leider immer mit dazu.

Viel Erfolg weiterhin

1 Like

Moin,

heute war es beim validieren sehr schlimm – viele leere Tondateien, also ohne dass etwas zu hören war.

Ist eine leere Aufnahme ein Fall für “Nein” bei der Validierung oder ein Fall von “Melden”?

Außerdem ist mir aufgefallen, dass ein Satz immer wieder auftaucht, obwohl man ihn wegen eines Rechtschreibfehlers gemeldet hat. Das ist doch nicht Sinn der Übung, dass das Ganze trotz Meldung in der Pipelin bleibt, oder? Wenn der Satz immer und immer wieder die Runde dreht, dann wird irgendwann auch jemand (und sei es nur aus versehen) auf “Ja” klicken.

Gruß

Ad 1) Ich drücke konsequent ‘Nein’, da ist wieder ein Saboteur unterwegs

ad 2) ist mir auch schon öfters untergekommen, ich wiederhole auch hier: Melden als Rechtschreibfehler, irgendwann wird dieser Satz dann hoffentlich aussortiert werden.

Achtung (auch: an alle): in letzter Zeit ist entweder die allgemeine Internet-Latenz sprunghaft höher geworden, oder der mozilla-Server ist oft überlastet. Ich habe auch anscheinend leere Dateien bei der Kontrolle, aber es wird nicht das “Wellensymbol” abgespielt und der Play/Pause-Button wechselt wieder automatisch sein Symbol zurück, sondern ich habe das Gefühl, dass überhaupt nichts bei mir ankommt. Da drücke ich entweder auf “Weiter” oder ich refreshe die Seite (meist: ‘F5’) - oft geht es dann wieder und es wird eine Aufnahme abgespielt. Dies vllt. mal nur so am Rande als Hinweis.

(PS: was neulich mal jemand anderes hier geschrieben hat, dass es evtl nur mein ISP sein könnte - in dem Fall telekom: nein: andere Anwendungen übers Netz flutschen tip-top, und ein ‘DSL-Check’ gibt mit meine volle Leistung als Resultat; daher kann es eigentlich nicht mein eigener ISP sein. Habe auch schon mal in der FritzBox ‘neu verbinden’ gemacht, gibt dann eine neue IP und man kommt beim ISP auf einen neuen Knoten - auch das wars aber nicht)

Gruss
FB

Leider hat Melden keine Auswirkung auf den Satz. Wenn man einen Satz meldet wird die Meldung nur in eine Tabelle geschrieben und muss von irgendjemanden manuell abgearbeitet werden. Ich weiß nicht, ob das für Deutsch überhaupt schon mal jemand gemacht hat. @mkohler weißt Du dazu mehr? Ich würde das gerne mal für Deutsch angehen, wenn das noch niemand gemacht hat.

Ich finde, das ist einer der größten offenen Themen der Webseite und Menschen regen sich schon seit Langem darüber auf.

Nö. Ich würde vorschlagen im Common Voice Channel zu fragen.

Santana? Also wenn die Gema das spitz kriegt, gibts ne Abmahnung, das ist ja wohl klar!

da man bei Common Voice auch anonym sprechen kann, gibt es da kaum eine Handhabe (außer über cookies)