✅ Vorläufige Richtlinien für das Validieren von Sätzen

Vorläufige Richtlinien für die Kontrolle der Aufnahmen
(freie Übersetzung der englischen Richtlinien ins Deutsche von @mozilla_fire und mir)

Probleme mit der Aufnahme selbst:

Vorlage falsch vorgelesen:

Du solltest sehr sorgfältig überprüfen, dass das, was aufgezeichnet wurde, ganz genau das ist, was geschrieben steht. Klicke auf Nein, wenn es nur geringfügige Fehler aufweist. Häufig vorkommende Fehler können sein (ohne Anspruch auf vollständige Auflistung aller Gründe):

  • ausgelassene Artikel, z.B.: ‘ein’, ‘der’ am Anfang, unvollständiges erstes Wort (weil man schon spricht, bevor man auf ‘Aufnehmen’ geklickt hat)

  • vergessene oder undeutliche Plural ‘s’; oder verschluckte Pluralendungen (’…en’, ‘…es’) am Ende eines Wortes

  • Undeutliche ‘t’, stattdessen ‘d’; analog hört man oft statt ‘p’ nur ein ‘b’

  • Nicht vorhandene (ausgelassene) Buchstaben in einem Wort; auch: Buchstaben gesprochen, die gar nicht da sind.

  • Eigene Ergänzungen eines Satzes (sogenannte “Umdeutungen”, die Fehlerkorrektur, die unser Gehirn selbstständig übernimmt; hier ist ein “sich selber zuhören” ganz, ganz wichtig)

  • Vorlesen eines Plural - ‘s’ wo im Text keiner steht; auch das Weglassen eines ‘s’ oder anderer Endungen (geschweige denn: ganzer Silben)

  • Unzulässige Konkatenation (die es umgangssprachlich oft gibt), die aber nicht im geschriebenen Satz so stehen.

  • Mehrere Anläufe ein Wort vorzulesen

Beispiele (im Deutschen):

  • :white_check_mark: “auf der einen Seite … auf der anderen Seite”
  • :x: “… auf der andren Seite”, oder “auf der andern Seite”;
  • :white_check_mark: “wir sind…”
  • :x: (im Dialekt oft üblich): “Wir sin”, “Mer sind…”, oder noch extremer: “Mer san …”
  • :x: Abgeschnittene Wortendungen am Satzende, weil man zu schnell auf ‘STOP’ beim Recording geklickt hat (Hinweis: man kann seinen eigenen Text auch nochmal anhören, man >sollte< dies sogar immer tun).
  • :x: Versprecher beim Vorlesen und Wort- oder Silbenwiederholung (besser: Recording abbrechen und nocheinmal aufnehmen, dies geht sogar mehrmals, bis es korrekt ist)
  • :x: Stottern, nicht-flüssiges Vorlesen (Hinweis: es hilft, wenn man VOR der Aufzeichnung den Satz einmal stumm sich durchliest).

Viele Beispiele aus der englischen Richtlinie lassen sich nicht 1:1 ins Deutsche übertragen, es lohnt sich daher auch noch die englischen Regeln zu lesen, um ein besseres Verständnis von qualitativ hochwertigen Sätzen zu bekommen.

Vorsicht bei vermeintlich falscher Aussprache und Betonung!

Sei vorsichtig, wenn Du einen Text aufgrund einer Betonung zurückweisen willst. Betonung und Wortmelodie, genauso wie Satzmelodie (etwa das Anheben der Stimme bei Fragesätzen) können regional sehr unterschiedlich ausgeprägt sein. Solche für Dich ungewohnten Betonungen und Sprachmelodien können sogar in Deiner eigenen Sprache in anderen Gegenden üblich sein, die Du selbst aber als ungewöhnlich und falsch empfingen könntest. Weise einen Text allein aus diesem Grund noch nicht zurück, sondern lasse auch solche für Dich ungewohnten Aussprachen zu und ermögliche damit eine vielfältige Sprachdatenbank

Andererseits, wenn Du der Meinung bist, dass der Sprecher möglicherweise ein bestimmtes Wort noch nie gehört hat und lediglich rät, wie es wohl ausgesprochen werden könnte, dann weise diese Aufnahme durchaus zurück. Insbesondere dann, wenn Du selbst weißt, wie ein Begriff richtig ausgesprochen wird.

Im Zweifel kannst Du eine Aufnahme jederzeit überspringen, wenn Du Dich weder für ‘akzeptieren’ noch für ‘zurückweisen’ entscheiden kannst.

Nuscheln

  • :x: Unverständliche Aufnahmen kann man ablehnen

Mikrofonfehler

Manche Mikrofone knacken, übersteuern, verzerren die Stimme stellenweise oder erzeugen andere Probleme. Wir möchten möglichst realistische Daten sammeln, daher sind solche Aufnahmen in Ordnung, so lange der gesprochene Text weiterhin verständlich bleibt

  • :white_check_mark: [Knack] Die gewaltigen Dinosaurier [Wort verzerrt aber noch verständlich] wandelten über den Planeten.
  • :x: Die gewaltigen [Knack] wandelten über [unverständlich verzerrt] …neten.

Hintergrundgeräusche:

Wir wollen die Algorithmen dazu bringen, dass sie ein gewisses Maß an Hintergrundgeräusch akzeptieren und auch sauber verarbeiten können. Sogar relativ laute Geräusche können noch verarbeitet werden, vorausgesetzt, dass Dich es (als menschlicher Zuhörer) nicht dabei hindert (bei sehr genauem Zuhören), alles am Text verstehen zu können. Ebenfalls ist leise Hintergrundmusik zu okay, vorausgesetzt, sie hindert Dich nicht am Verständnis des Textes; würde die Musik dafür zu laut dann ist dies nicht mehr akzeptabel.

Überlagernde Störgeräusche oder Fehler, die man während dem Vorlesen macht (Husten, Räuspern, Stimme versagt oder wird belegt oder heiser, oder es kommt silbenweise nur “heiße Luft”): hier ist der Text nicht mehr vollständig und sauber zu hören, daher ist eine solche Aufnahme zurückzuweisen.

Tipp: Mit geschlossenen Augen zuhören, und entscheiden, ob man ohne das geschriebene Wort vor Augen den Text tatsächlich noch verstehen würde

Hintergrund-Stimmen:

Leises und/oder unverständliche Stimmen sind okay, aber wir wollen keine zusätzlichen Stimmen, die den Algorithmus dazu bringen, weitere (nicht im Text vorhandenen) Wörter zu identifizieren. Wenn Du einzelne (überlagerte) Worte heraushören kannst: bitte die Aufzeichnung zurückweisen.

Typische Situationen, in denen dies vorkommt: Der TV ist noch an, oder es finden nebenher [im selben Raum] noch andere Unterhaltungen statt.

Lautstärke einer Aufzeichnung

Es gibt natürliche Variationen in der Lautstärke der Aufnahmen. Weise bitte nur Aufzeichnungen zurück, die derart übersteuert sind, dass es im Lautsprecher (Kopfhörer) bereits ‘kracht/knackst’. Oder im anderen Extrem, wenn die Aufzeichnung bei Dir, trotz maximaler Lautstärke, nicht zu verstehen ist (ohne dass Du zusätzlich den Text in geschriebener Form zur Hilfe nimmst).

Variationen des Sprachstils:

Wir gehen davon aus, dass die Sprecher mit Ihrer normalen Alltags-Stimme sprechen. Du kannst auch Aufnahmen akzeptieren, die gelegentlich gebrüllt, geflüstert oder in andere Art und Weise ‘dramatisiert’ vorgetragen werden. Bitte weise aber Aufnahmen zurück, die gesungen werden und solche, die sich nach einer synthetischen Stimme anhören.
Hast Du Probleme mit dem eigentlichen Text der Sätze? Dafür gibt es im englischen Original der Guidelines einen Link zu einem Diskussionsfaden bzgl Regeln für neue Texte. Fehler im Text können jederzeit über den Melde-Button unten links gemeldet werden.

Immer noch unsicher?

Wenn Du noch keine Antwort auf Deine Fragen gefunden hast, so entscheide nach bestem Wissen und Gewissen, im Zweifelsfall benutze (bei der Kontrolle einer Aufnahme) den Button “Überspringen” unten rechts.


Übersetzer, Anmerkungen:
@mozilla_fire (ist in den Top 10 der deutschen Reviewer und in den Top 100 bzgl der Gesamt-Reviewer). Diese Übersetzung wurde dann noch von mir (@stergro) angepasst und erweitert.

@jf99 kannst Du diesen Thread bitte anpinnen?

Dieser Text wird sich sicher noch verändern. Wenn Ihr Anmerkungen, Ideen oder bessere Beispiele habt, dann schreibt sie hier bitte. Ich füge ich sie dann gerne noch hinzu.

2 Likes

@stergro Gute Arbeit habt ihr hier geleistet. Ich würde den Thread gerne anpinnen, wenn ich wüsste wie. Ich würde dich auch gerne zum Moderator ernennen, da du offensichtlich im Moment mehr Zeit für Common Voice findest als ich. Auch hier bin ich mir leider nicht sicher, wie bzw. ob ich das kann.