Modèle français 0.4 pour DeepSpeech v0.6

Hello,

J’ai repris le Docker précédemment partagé, et remis à jour sur la version actuelle de DeepSpeech (v0.6).

Il a été entraîné avec le Docker disponible https://github.com/Common-Voice/commonvoice-fr/blob/master/DeepSpeech/CONTRIBUTING.md

  • entraîné à partir de 0
  • importation de LinguaLibre
  • importation de TrainingSpeech
  • importation de Common Voice v3

Dans les gros changements par rapport à 0.3.4 :

  • utilisation de Common Voice v3 français avec jusqu’à 8 occurrences d’une même phrase
  • modification de la fréquence limite pour le calcul de mfcc
  • réduction de la complexité du LM avec filtrage des 500k top mots

Vous pouvez le trouver (avec les paramètres d’entraînement et la sortie des tests) sur:

Il reste encore beaucoup de limitations et même si les tests dans la nature effectués avec ce nouveau modèle montrent une bonne amélioration de la qualité générale grâce à l’augmentation de Common Voice, c’est encore très loin d’être parfait.

1 Like

(post withdrawn by author, will be automatically deleted in 24 hours unless flagged)

(post withdrawn by author, will be automatically deleted in 24 hours unless flagged)

(post withdrawn by author, will be automatically deleted in 24 hours unless flagged)

(post withdrawn by author, will be automatically deleted in 24 hours unless flagged)