utilisation de Common Voice v3 français avec jusqu’à 8 occurrences d’une même phrase
modification de la fréquence limite pour le calcul de mfcc
réduction de la complexité du LM avec filtrage des 500k top mots
Vous pouvez le trouver (avec les paramètres d’entraînement et la sortie des tests) sur:
Il reste encore beaucoup de limitations et même si les tests dans la nature effectués avec ce nouveau modèle montrent une bonne amélioration de la qualité générale grâce à l’augmentation de Common Voice, c’est encore très loin d’être parfait.
As you can see, the work to update training codebase to use 0.7 was done, but I have not yet had time to work again on that, we’re pretty busy with the DeepSpeech 0.8/0.9/1.0 (plus other tasks aside of deepspeech).
Salut,
Je pensais entrainer mon propre modèle pour le français mais j’ai d’abord commencé par celui ci. Je voudrais savoir combien de temps il a fallu pour entrainer ce modèle.
lissyx
((slow to reply) [NOT PROVIDING SUPPORT])
12
Je crois que je le documente dans CONTRIBUTING.md mais le dernier modèle (tu as répondu à un vieux thread, c’est pas celui du dernier modèle qui est ici Modèle Français 0.6 pour DeepSpeech v0.7, v0.8, v0.9) c’est grosso modo ~24h sur mes deux RTX2080Ti, pour ~1200h d’audio.