Wer kontrolliert die Sätze, die zum 'Sprechen' drankommen?

mkohler (Michael Kohler) March 17, 2020, 6:43pm 2

Hallo Freebird

Könntest du mir ein paar Beispiele geben, falls du weitere findest? Dann kann ich schauen von wo die kommen. Ein Kandidat wäre der Wikipedia-Export, welcher jedoch unter der akzeptablen Fehlerquote liegt.

Jap.

Solange es verständlich und korrekt ist, ist alles ok. Wir brauchen kein homogenes Datenset, das würde sogar schaden. Schlussendlich sollen Produkte, welche Common Voice Daten oder Modelle verwenden, alle verstehen, und nicht nur wenn man langsam spricht. Das hilft auch anderen Einsatzmöglichkeiten abgesehen von Spracherkennung.

Weitere Infos von der Common Voice Webseite:

1 Like

Topic		Replies	Views
An alle 'Specher': Kontrolle? Deutsch (de)	4	912	April 12, 2020
Wir haben 600 geprüfte Stunden erreicht, 50% des ersten Ziels Deutsch (de)	56	2391	May 26, 2020
:white_check_mark: Vorläufige Richtlinien für das Validieren von Sätzen Deutsch (de)	7	2045	October 3, 2021
✅ Die Juni-Validierungskampagne - alles was vor dem 22. Juni validiert wird, landet in der neuen Version des Datensatzes Deutsch (de)	14	1839	June 22, 2020
Rules for German sentence contribution / Deutsche Sprache Deutsch (de) sentence-collection	22	3225	June 29, 2019

Wer kontrolliert die Sätze, die zum 'Sprechen' drankommen?

Related topics