✅ Die Juni-Validierungskampagne - alles was vor dem 22. Juni validiert wird, landet in der neuen Version des Datensatzes

stergro · June 21, 2020, 12:49pm

Hallo zusammen,

Es wird bald ein neue Version des Common Voice Datensatz geben und wir wollen sicherstellen, dass wir so viele validierte Stunden in dieser Version haben wie möglich.

Das Ziel ist den neuen Datensatz ungefähr am 30. Juni 2020 zu veröffentlichen. Weil die Veröffentlichung Vorbereitung benötigt werden alle Spenden und Validierungen die vor dem 22. Juni 2020 eingehen Teil des Datensatzes sein.

Die meisten Sprachen haben signifikant mehr aufgenommene Stunden als validierte Stunden. Wir bitten Euch deshalb fokussiert Euch in der Zeit bis zum 22. Juni darauf Sätze zu validieren. Dadurch werden mehr Aufnahmen im kommenden Datensatz nutzbar sein.

Das wird auch Entwicklern dabei helfen bessere Spracherkennungs-Modelle zu entwickeln, was wiederum mehr Menschen dazu ermuntern kann bei Common Voice mitzuarbeiten.

Wie kannst Du helfen?

Wenn Du bereits bei Common Voice mithilfst , fokussiere deine Zeit auf das Anhören und setze Dir ein persönliches Ziel für Deinen Benutzer für regelmäßige Erinnerungen.

Bitte ließ und verbreite die Richtlinien zum Validieren um besser zu verstehen, wie man richtig validiert.

Sprich mit Deiner Communit und erkläre warum im Moment das Validieren besonders sinnvoll ist. Ermutige andere ein Profil anzulegen und ein persönliches Ziel. Übersetze diesen Text und die Validierungsrichtlinien in Deine Sprache und veröffentliche sie auf Discours in dem Bereich für Deine Sprache.

Überlege Dir spaßige Aktionen die Menschen dazu bringen jeden Tag ein paar Minuten ihrer Zeit für Common Voice zu verwenden. Sprich in Deinen Gruppen und sozialen Netzwerken darüber.

Vielen Dank an alle für Euren Beitrag am Erfolg von Common Voice!

Dieser Post ist eine freie Übersetzung von Rubens englischen Post.

xyz0815 · June 4, 2020, 2:11pm

Hallo,

wäre es vielleicht möglich eine deusche Übersetzung der Richtlinien mit deutschen gut und schlecht Beispielen in diesem Forum bereitzustellen?

Weiterhin habe ich geraden 90 Spenden validiert und bekomme: “Für diese Sprache gibt es keine Aufzeichnungen mehr, die überprüft werden könnten…” Nach einem Logout und erneutem Login konnte ich allerdings weitervalidieren. Nach weiteren 90-100 Validierungen kommt der gleiche Hinweis erneut.

Gruß xyz0815

stergro · June 6, 2020, 10:54am

Eine Übersetzung ist sicher sinnvoll, ich weiß nur nicht, ob ich in den nächsten Tagen Zeit dafür finde. Das kann natürlich auch gerne jemand anderes übernehmen.

mozilla_fire · June 13, 2020, 11:33am

OK, dann kontrolliere ich mal ein bischen weiter …

Die Regeln sprechen mir aus der Seele, genau so habe ich schon immer kontrolliert.

Wenn eine Übersetzung gewünscht wird, dann mache ich mich gerne mal daran.

Gruss

mozilla_fire · June 13, 2020, 11:33am

Vorschlag zur (freien) Übersetzung der englischen guidelines:

Entwurf Richtlinien für die Kontrolle der Aufnahmen
(frei übersetzt ins Deutsche und mit deutschen Beispielen angereichert)

Probleme mit der Aufnahme selber:

Vorlage falsch gelesen:

Sie sollten sehr sorgfältig überprüfen, daß das, was aufgezeichnet wurde, ganz genau das ist, was geschrieben steht. Weisen Sie es zurück, selbst wenn es nur geringfügige Fehler aufweist. Häufig vorkommende Fehler können sein (ohne Anspruch auf vollständige Auflistung aller Gründe):

ausgelassene Artikel , z.B.: ‘ein’, ‘der’ am Anfang, unvollständiges erstes Wort (weil man schon spricht, bevor man auf ‘record’ geklickt hat)

vergessene oder undeutliche Plural ‘s’; oder verschluckte Pluralendungen (’…en’, ‘…es’) am Ende eines Wortes

undeutliche ‘t’, stattdessen ‘d’; analog hört man oft statt ‘p’ nur ein ‘b’

nicht vorhandene (ausgelassene) Buchstaben in einem Wort; dito: Buchstaben gesprochen, die gar nicht da sind.

eigene Ergänzungen eines Satzes (sogenannte “Umdeutungen”, die Fehlerkorrektur, die unser Gehirn selbstständig übernimmt; hier ist ein “sich selber zuhören” ganz, ganz wichtig)

Vorlesen eines Plural - ‘s’ wo im Text keiner steht; dito da Weglassen eines ‘s’ oder anderer Endungen (geschweige denn: ganzer Silben)

unzulässige Konkatenationen (die die Umgangssprache oft macht), die aber nicht im geschriebenen Satz so stehen.
Beispiele (im Deutschen): Statt wie geschrieben “auf der einen Seite … auf der anderen Seite”
hört man “… auf der andren Seite”, oder “auf der andern Seite”;
oder statt “wir sind…” hört man (im Dialekt oft üblich): “Mer sind…”, oder noch extremer: “Mer san …”

Abgeschnittene Wortendungen am Satzende, weil man zu schnell auf ‘STOP’ beim Recording geklickt hat (Hinweis: man kann seinen eigenen Text auch nochmal anhören, man >sollte< dies sogar immer tun).

Versprecher beim Vorlesen und Wort- oder Silbenwiederholung (besser: Recording abbrechen und nocheinmal aufnehmen, dies geht sogar mehrmals, bis es korrekt ist)

Stottern, nicht-flüssiges Vorlesen (Hinweis: es hilft, wenn man VOR der Aufzeichnung den Satz einmal stumm sich durchliest).

Viele Beispiele aus der englischen Richtlinie lassen sich nicht 1:1 ins Deutsche übertragen, daher sind bereits oben einige oft vorkommende Fehler in den deutschen Texten aufgeführt.

Vorlage im Prinzip richtig gelesen, aber als Kontrolleur passt mir was nicht, dies könnte sein:

Betonung:

Seien Sie vorsichtig, wenn Sie einen Text aufgrund einer Betonung zurückweisen wollen. Betonung und Wortmelodie, genauso wie Satzmelodie (etwa das Anheben der Stimme bei Fragesätzen) können regional sehr unterschiedlich ausgeprägt sein. Solche für Sie ungewohnten Betonungen und Sprachmelodien können sogar in Ihrer eigenen Sprache in anderen Gegenden üblich sein, die Sie selber aber als ungewöhlich und falsch empfingen könnten. Weisen Sie einen Text alleine aus diesem Grund noch nicht zurück, sondern lassen Sie auch solche für Sie ungewohnten Aussprachen zu und lassen Sie diese in die Sprachdatenbank hineinkommen.

Andererseits, wenn Sie der Meinung sind, dass der Sprecher möglicherweise ein bestimmtes Wort noch nie gehört hat und lediglich herumrät, wie es wohl ausgesprochen werden könnte, dann weisen Sie diese Aufnahme durchaus zurück.

Schliesslich können Sie eine Aufnahme überspringen, wenn Sie sich weder für ‘akzeptieren’ noch für ‘zurückweisen’ entscheiden können.

(A.d.Ü): andere Unverständlichkeiten:
Zu schnelles Sprechen: dies ist kein Weltrekord-Versuch, wieviele Silben man pro Sekunde unterbringen kann. Wenn ein Text einfach zu schnell geprochen ist, dann hat ja auch ein Mensch keine Chance, den Gegenüber zu verstehen. Und hier geht es nun mal um “natürliche gesprochene Sprache”.

Zu vernuscheltes Sprechen: auch ein Kaugummi oder Naschsachen fördern nicht die Verständlichkeit des Gesprochenen. Wenn Sie beim Anhören/Kontrollieren der Meinung sind, dass jemand hier zuviel des Guten tut und der Text dadurch nicht mehr verständlich rüberkommt, so weisen Sie die Aufnahme zurück.

Falsche Mirkofoneinstellungen: ob dies nun ein technisches Problem ist, oder ob es nur keinen gibt, des es dem Sprecher denn mal ‘stecken’ könnte: es gibt Aufnahmen, die ständig die Explosiv-Laute (‘t’, ‘p’) übersteuern. Solche Aufnahmen sind kritisch zu bewerten: kommt dies nur einmalig vor und ist dies nicht derart, dass ausgerechnet ein einzelnes aber für das Gesamtverständnis zentrale Wort verunstaltet wird, so kann man es noch akzeotieren. Würde ein Satz mit solchen Fehlern überladen wirken oder ist genau das eine Wort unverständlich, ohne dass der ganze Satz sich einem (sagen wir mal, ohne das geschriebene Wort zusätzlich vor Augen zu haben) nicht erschliesst, so würde ich die Aufnahme zurückweisen. (Sicherlich spielt dieser Absatz hier ein bischen in die Richtung einer Anmerkung weiter unten, die sich mit Störgeräuschen befasst)

Hintergrundgeräusche:

Wir wollen die Algorithmen dazu bringen, dass sie ein gewisses Mass an Hintergrundgeräusch akzeptieren und auch sauber verarbeiten können. Sogar relativ laute Geräusche können noch verarbeitet werden, vorausgesetzt, daß es Sie (als menschlichen Zuhörer) nicht dabei hindert (bei sehr genauem Zuhören), alles am Text verstehen zu können. Ebenfalls ist leise Hintergrundmusik zu akzeptieren, vorausgesetzt, sie hindert Sie nicht am Verständnis des Textes; würde die Musik dafür zu laut (mein Tip: mal mit geschlossenen Augen zuhören, und entscheiden, ob man ohne das geschriebene Wort vor Augen den Text tatsächlich noch verstehen würde), dann wäre dies nicht mehr akzeptabel.

Zusatz des Übersetzers: es kommt auch ganz auf die Sprache des Hintergrund-Sounds (und Gespräche) an: wenn ich (in diesem Fall reden wir ja von deutschen Texten) im Hintergrund deutsche Nachrichten, Info-Radio, deutsche Schlager, laufen habe und es dann schon lediglich mittellaut ist, dann kann das schon das “AUS” Kriterium sein; in gleicher Lautstärke dagegen etwas in Englisch (oder noch einer weniger verbreiteten Sprache), das kann noch OK sein. (Vice versa wäre es wenn er hier um englische Aufnahmen mit englischer Hintergrundmusik/Hintergrundsprache wäre. Aber hier sind wir ja bei Regeln für das deutsche Forum).

Einmalige Störgeräusche am Anfang oder Ende: (das habe ich mal woanders gelesen, das ist nicht im engl. Originaltext der Guidlines): solche Störgeräusche werden rausgefiltert.

Überlagernde Störgeräusche oder Fehler, die man während dem Vorlesen macht (Husten, Räuspern, Stimme versagt oder wird belegt oder ‘kiekst’, oder wird heiser, oder es kommt silbenweise nur “heisse Luft”): hier ist der Text nicht mehr vollständig und sauber zu hören, daher ist eine solche Aufnahme zurückzuweisen.

Periodische Störgeräusche, die durch z.B ein Mikrofon-Kabel oder durch scheuernde Leitungen am Headset-Mikro stammen, und die permanent während der Aufnahme zu hören sind (so ähnlich, als wie wenn jemand ständig eine Papiertüte zusammenknüllt während er spricht): bitte solche Aufnahmen ebenfalls zurückweisen. (Hinweis: auch hier hilft es, wenn man es sich zur Regel macht, seine eigenen Aufzeichnungen nocheinmal anzuhören, bevor man sie abschickt).

A.d.Ü: Solche Störungen können auch durch folgendes kommen: Ihre Aufnahme vom Mirko/Headset wird von Ihrem PC/Laptop eingescannt und auf Festplatte geschrieben. Ältere Systeme, insbes. Laptops, und langsame Festplatten, ferner zuviele andere Programme, die während der Aufnahme die Festplatte und den Datenbus beanspruchen, können dazu führen, dass ein prinzipiell fehlerlos gesprochener Satz leider schon fehlerhaft, in diesem Fall, zerhackt, auf Ihrer eigenen Festplatte landet.(Die Fehlerbehebung dazu dürfte auf der Hand liegen; diesen Fehler zu entdecken setzt allerdings voraus, dass man seine eigenen Aufnahmen vor dem Absenden auch einmal kontrolliert.)

Hintergrund-Gespräche:
Ein leiese Gemurmel ist OK, aber wir wollen keine zusätzlichen Stimmen die den Algorithmus dazu bringen, weitere (nicht im Text vorhandenen) Wörter zu identifizieren. Wenn Sie einzelne [überlagerte) Worte heraushören können: bitte die Aufzeichnung zurückweisen. Typische Situationen, in denen dies vorkommt (hallo, an alle, die Aufnahmen machen, die nicht mit einem dicht an den Lippen befindlichen Headset-Mikrofon gemacht werden, sondern mit anderen Mikros: die haben eine andere “Characteristik”): der TV ist noch an, oder es finden nebenher [im selben Raum] noch andere Unterhaltungen statt.

Lautstärke einer Aufzeichnung
Natürlich gibt es Unterschiede, wie Menschen etwas sprechen. Weisen Sie bitte nur Aufzeichnungen zurück, die derart übersteuert sind, dass es im Lautsprecher (Kopfhörer) bereits ‘kracht/knackst’. Oder im anderen Extrem, wenn die Aufzeichnung bei Ihnen, trotz maximaler Lautstärke, nicht zu verstehen ist (nicht, ohne dass Sie zusätzlich den Text in geschriebener Form zur Hilfe nehmen)

Sprecher, die Betonungs-Effekte verwenden:
Wir gehen davon aus, dass die Sprecher mit ihrer normalen Alltags-Stimme sprechen. Sie können auch Aufnahmen akzeptieren, die gelegentlich gebrüllt, geflüstert oder in andere Art und Weise ‘dramatisiert’ vorgetragen werden. Bitte weisen Sie aber Aufnahmen zurück, die gesungen werden und solche, die sich nach einer synthetischen Stimme anhören (A.d.Ü: das hatte ich tatsächliche mal eine Weile lang, das hat sich echt künstlich angehört)

Haben Sie Probleme mit dem eigentlichen Text? Dafür gibt es (siehe im englischen Original der Guidlines) einen Link zu einem Diskussionsforum bzgl Regeln für neue Texte.

A.d.Ü.: es gibt auch auf der Aufzeichnungs-Seite (dort, wo Sie Sprechen/Record machen können) einen Button/Symbol “Melden”, wo Sie einen Text (mit Möglichkeit der Begründung) zurückweisen können. Sie “müssen” einen Text nicht sprechen, wenn Sie denken, er ist z.B unsinnig oder hat die falsche Grammatik.

Wenn Sie bisher noch keine Antwort auf Ihr Problem gefunden haben, so entscheiden Sie nach bestem Wissen und Gewissen, im Zweifelsfall benutzen Sie (bei der Kontrolle einer Aufnahme) den Button “Überspringen”.

Übersetzer, Anmerkungen:
Freebird (ist in den Top 10 der deutschen Reviewer und in den Top 100 bzgl der Gesamt-Reviewer)

stergro · June 13, 2020, 2:17pm

Sieht gut aus, danke! Willst Du das in einen eigenen Thread posten? Wenn Du willst, kann ich auch noch die Formatierung wie im Original hinzufügen, bei der Gelegenheit lese ich noch mal genauer Korrektur.

Wer ist hier eigentlich Admin für das deutsche Forum? Diesen Post sollte man dann oben anpinnen.

mozilla_fire · June 13, 2020, 2:34pm

Gerne, wenn Du das Formatieren machen magst. Evtl auch gut als neuen Thread und anpinnen. Aber warte evtl mal 2-3 Tage ab, ob noch weiteres Feedback kommt.

Ich weiss auch nicht, wer MOD hier ist. Falls derjenige das liest, bitte gebe Dich zu erkennen.

mozilla_fire · June 17, 2020, 2:15pm

Nun, viele Clicks, aber kein Beitrag. Viel ist hier im Forum ehrlich gesagt nicht los. Ob die meisten von denen, die hier Beiträge einsprechen oder kontrollieren dieses Forum überhaupt schon entdeckt haben? Leider scheinen die Accounts / Usernamen nicht miteinander gekoppelt zu sein.

stegro: wenn Du mags, kannst Du das als neuen Thread und formatiert machen (dafür hatte ich nun wirklich keine Zeit). Kannst Du das auch oben anpinnen oder brauchen wir dafür einen Mod.

Und ich weiss immer noch nicht, wer Mod ist; und wer bestimmt, wer Mod wird weiss ich auch nicht !

othiele · June 19, 2020, 1:24pm

Mod sollte @jf99 sein, packt das doch mal in einen neuen Thread und dann pinnt er/sie das sicher auch an. Sonst frage ich mal drüben in DeepSpeech an.

Das Übersetzen ist ja schon immer ganz schön Arbeit. Vielen Dank dafür.

stergro · June 19, 2020, 8:52pm

Ich wollte den Text noch wie im Original formatieren, das werde ich morgen erledigen und das gleich als neuen Post hier im Forum veröffentlichen.

Auch von mir noch einmal Dank!

mozilla_fire · June 20, 2020, 8:30am

Kleinere Rechtschreibfehler in meiner “Übersetzung” (in dem langen Text oben) müsste man noch korrigieren, wenn man das als neuen Artikel einstellt. Danke.

F

stergro · June 20, 2020, 8:00pm

Ich schreibe gerade den post und formuliere nur einige kleinere Sachen um. Nur zu diesem Part möchte ich noch etwas sagen:

Zu schnelles Sprechen: dies ist kein Weltrekord-Versuch, wieviele Silben man pro Sekunde unterbringen kann. Wenn ein Text einfach zu schnell geprochen ist, dann hat ja auch ein Mensch keine Chance, den Gegenüber zu verstehen. Und hier geht es nun mal um “natürliche gesprochene Sprache”.

Eine Aufnahme darf nicht länger als 10 Sekunden dauern, deswegen sind Spender bei langen Sätzen oft gezwungen sehr schnell zu sprechen. Außerdem kann das System schnelle Sprache erkennen, wenn alles richtig ausgesprochen wird. Da diese Regel im Original nicht vorkommt, lasse ich sie auch aus dem Post raus.

Ich habe auch den Drang den Text in die Du-Form zu ändern, weil das mehr dem Ton des Originals und der Sprache hier im Forum entspricht. Wie seht ihr das?

EDIT: hier: ✅ Vorläufige Richtlinien für das Validieren von Sätzen

Ich werde den Text nach und nach sicher noch weiter verfeinern.

mozilla_fire · June 21, 2020, 7:20am

Ja, ist OK von meiner Seite aus

Ich wollte trotzdem noch was dazu sagen, warum ich selbständig eine Regel zum (Ironie-an) Schnellsprech-Wettbewerb (Ironie-aus) eingefügt habe: mir ist die Regel, dass eine Aufnahme nur max 10 Sekunden lang sein darf zwar auch schon mal wo begegnet, ich denke aber, dass einem Sprecher dies nicht unbedingt immer bewusst ist. Ich selber habe neben der >Kontrolle< ja nun auch nicht wenige Einheiten hier selber aufgesprochen, ich habe dabei jedoch auch bei längeren Sätzen immer eine mittlere Sprechgeschwindigkeit eingehalten, und bin dabei >>niemals<< auch nur vom System verwarnt worden mein recording wäre zu lange. Also ich denke, dass man ruhig die Sätze in gemässigtem Tempo sprechen kann, ohne (teilweise oder ständig) an die 10-Sek-Grenze zu stossen.

Nein, ich denke vielmehr, dass manche Vorleser generell dieses Tempo draufhaben und das auch eindeutig bei Sätzen, die nicht soooo lange sind; und eben dieses Zuschnellsprechen trägt dann absolut nicht zur Verständlichkeit des Gesagten bei.

So habe ich durchaus einige MG-Salven an Wörtern schon zurückgewiesen, weil ich der Meinung bin, auch wenn ein Computerprogramm in Millisekunden unser Gesprochenes in 44000 BIT/s zerlegen und korrekt bewerten mag, finde ich: das ist einfach nicht der Durchschnitt von natürlich gesprochener Sprache. Auch wenn man bei sehr genauem Zuhören denken mag, dass das alles korrekt ausgesprochen sein mag (also ich muss mir solche MG-Wort-Salven immer 3x anhören, um sagen zu können: “eigentlich ist ja alles korrekt ausgesprochen — aber” … )

Und die englischen Regeln sind ja auch noch “im Fluss”, es heisst ja ausdrücklich im engl. Original, dass dies ein “Entwurf” für Regeln ist.

So, das wollte ich sagen, warum ich diese Regel dazu erfunden habe: weil ich denke, dass es manche Sprecher einfach übertreiben. (Und leider kann man hier in diesem Mozilla-System ja kein Feedback direkt an die Sprecher rückübermitteln; ok, das würde wahrsch. die Programmierkapazität und auch die Datenbank-Server überlasten).

F

othiele · June 22, 2020, 8:58am

Superidee, wer hier mitmacht besteht eh nicht auf Sie.

Natürlich sollen keine unnatürlichen Chunks reinkommen, aber manche Leute reden nun einmal schnell und wir z.B. erkennen damit O-Töne im Fernsehen oder in Radiosendungen. Und gerade im Radio wird schnell gesprochen, was wir aktuell nur sehr schlecht erkennen können, weil wir so wenige schnell gesprochene Trainingsdaten haben Also superschnell ist doof, aber so schnell wie im Radio oder wie Leute, die etwas nervös sind gerne.

stergro · June 22, 2020, 9:57am

Das verstehe ich. Ich würde es trotzdem gerne nicht in dem Regeln haben, weil “zu schnell” sehr subjektiv ist und das vielleicht von manchen falsch verstanden wird. Wenn ein Satz für Dich unverständlich oder wahrscheinlich falsch ist, kannst Du aber natürlich trotzdem weiter auf Nein klicken. Ich glaube wir sind in der komfortablen Situation, dass wir genügend Spender haben, um im Zweifelsfall immer auf Nein klicken zu können um die Qualität des Datensatzes hoch zu halten.

Noch zu einem älteren Post von Dir:

Die Sprachspezifischen Foren sind leider gut versteckt. Wenn man ins englische Common Voice Forum geht, muss man oben auf “Alle” klicken und dort die Sprache auswählen, das ist nicht sehr intuitiv. Man kommt zwar auch über den Link auf voice.mozilla.org/de direkt ins Deutsche Forum, aber darüber kommen sicher nicht alle.

Trotzdem antworten hier immer Leute, es dauert nur oft ein paar Wochen weil die meisten nicht jeden Tag hier hereinschauen.

EDIT: habe das mit den Sprachforen hier mal angesprochen: