Modèle français 0.4 pour DeepSpeech v0.6

Hello,

J’ai repris le Docker précédemment partagé, et remis à jour sur la version actuelle de DeepSpeech (v0.6).

Il a été entraîné avec le Docker disponible https://github.com/Common-Voice/commonvoice-fr/blob/master/DeepSpeech/CONTRIBUTING.md

  • entraîné à partir de 0
  • importation de LinguaLibre
  • importation de TrainingSpeech
  • importation de Common Voice v3

Dans les gros changements par rapport à 0.3.4 :

  • utilisation de Common Voice v3 français avec jusqu’à 8 occurrences d’une même phrase
  • modification de la fréquence limite pour le calcul de mfcc
  • réduction de la complexité du LM avec filtrage des 500k top mots

Vous pouvez le trouver (avec les paramètres d’entraînement et la sortie des tests) sur:

Il reste encore beaucoup de limitations et même si les tests dans la nature effectués avec ce nouveau modèle montrent une bonne amélioration de la qualité générale grâce à l’augmentation de Common Voice, c’est encore très loin d’être parfait.

1 Like

Hello @lissyx,

Are there a new version of french DeepSpeech (0.4.1) trained on the new french common voice dataset ? (15Go published on 06/22/20) ?

Not yet, you can track status and help on Github: https://github.com/Common-Voice/commonvoice-fr/projects/6

As you can see, the work to update training codebase to use 0.7 was done, but I have not yet had time to work again on that, we’re pretty busy with the DeepSpeech 0.8/0.9/1.0 (plus other tasks aside of deepspeech).

Yes I understand. Thank you I will take a look on the site mentioned