Modèle français 0.3.4 pour DeepSpeech v0.6

Hello,

J’ai repris le Docker précédemment partagé, et remis à jour sur la version actuelle de DeepSpeech (v0.6).

Il a été entraîné avec le Docker disponible https://github.com/Common-Voice/commonvoice-fr/blob/master/DeepSpeech/CONTRIBUTING.md

  • entraîné à partir de 0
  • importation de LinguaLibre
  • importation de TrainingSpeech
  • importation de Common Voice

Utilisation du language model, en augmentant celui-ci : maintenant c’est un dump wikipedia + débats de l’assemblée nationale.

Côté qualité, voici la sortie des tests:

Vous pouvez le trouver (avec les paramètres d’entraînement) sur:

(Mise à jour du lien pour être compatible avec la v0.6.0).
(Mise à jour du lien pour corriger un bug à l’export TFLite).

Pour information, j’ai fait une erreur avec la mise à jour pour la v0.6.0-alpha.10, il faut que je recommence l’entraînement et l’export : les modèles ne contenaient pas les métadonnées nécessaires, et donc DS_CreateModel() faisait une erreur:

E tensorflow/core/grappler/optimizers/meta_optimizer.cc:502] model_pruner failed: Invalid argument: Invalid input graph.
Unable to fetch metadata: Invalid argument: Tensor metadata_feature_win_len:0, specified in either feed_devices or fetch_devices was not found in the Graph

D’ici quelques heures je devrais pouvoir les remettre en ligne.

Ça a été un peu plus long que prévu, mais c’est fait.

2 Likes

J’ai mis en ligne une v0.3.3 qui correspond toujours aux mêmes paramètres, juste re-généré sur la v0.6.0 finale.

Je regarde un v0.4 en utilisant filter de KenLM pour filtrer le modèle de langage (pas de perte de qualité sur son utilisation avec le modèle anglais, et gain d’espace disque).