Hello,
J’ai repris le Docker précédemment partagé, et remis à jour sur la version actuelle de DeepSpeech (v0.6).
Il a été entraîné avec le Docker disponible https://github.com/Common-Voice/commonvoice-fr/blob/master/DeepSpeech/CONTRIBUTING.md
- entraîné à partir de 0
- importation de LinguaLibre
- importation de TrainingSpeech
- importation de Common Voice v3
Dans les gros changements par rapport à 0.3.4 :
- utilisation de Common Voice v3 français avec jusqu’à 8 occurrences d’une même phrase
- modification de la fréquence limite pour le calcul de mfcc
- réduction de la complexité du LM avec filtrage des 500k top mots
Vous pouvez le trouver (avec les paramètres d’entraînement et la sortie des tests) sur:
Il reste encore beaucoup de limitations et même si les tests dans la nature effectués avec ce nouveau modèle montrent une bonne amélioration de la qualité générale grâce à l’augmentation de Common Voice, c’est encore très loin d’être parfait.