Modèle français 0.4 pour DeepSpeech v0.6

lissyx · March 10, 2020, 8:55am

Hello,

J’ai repris le Docker précédemment partagé, et remis à jour sur la version actuelle de DeepSpeech (v0.6).

Il a été entraîné avec le Docker disponible https://github.com/Common-Voice/commonvoice-fr/blob/master/DeepSpeech/CONTRIBUTING.md

entraîné à partir de 0
importation de LinguaLibre
importation de TrainingSpeech
importation de Common Voice v3

Dans les gros changements par rapport à 0.3.4 :

utilisation de Common Voice v3 français avec jusqu’à 8 occurrences d’une même phrase
modification de la fréquence limite pour le calcul de mfcc
réduction de la complexité du LM avec filtrage des 500k top mots

Vous pouvez le trouver (avec les paramètres d’entraînement et la sortie des tests) sur:

Il reste encore beaucoup de limitations et même si les tests dans la nature effectués avec ce nouveau modèle montrent une bonne amélioration de la qualité générale grâce à l’augmentation de Common Voice, c’est encore très loin d’être parfait.

kamil_BENTOUNES · July 8, 2020, 8:59am

Hello @lissyx,

Are there a new version of french DeepSpeech (0.4.1) trained on the new french common voice dataset ? (15Go published on 06/22/20) ?

lissyx · July 8, 2020, 9:35am

Not yet, you can track status and help on Github: https://github.com/Common-Voice/commonvoice-fr/projects/6

As you can see, the work to update training codebase to use 0.7 was done, but I have not yet had time to work again on that, we’re pretty busy with the DeepSpeech 0.8/0.9/1.0 (plus other tasks aside of deepspeech).

kamil_BENTOUNES · July 8, 2020, 10:02am

Yes I understand. Thank you I will take a look on the site mentioned

Halmdring · March 29, 2021, 10:56am

Salut,
Je pensais entrainer mon propre modèle pour le français mais j’ai d’abord commencé par celui ci. Je voudrais savoir combien de temps il a fallu pour entrainer ce modèle.

lissyx · March 29, 2021, 11:22am

Je crois que je le documente dans CONTRIBUTING.md mais le dernier modèle (tu as répondu à un vieux thread, c’est pas celui du dernier modèle qui est ici Modèle Français 0.6 pour DeepSpeech v0.7, v0.8, v0.9) c’est grosso modo ~24h sur mes deux RTX2080Ti, pour ~1200h d’audio.

Topic		Replies	Views
Modèle français 0.3.4 pour DeepSpeech v0.6 Français (fr)	5	4227	March 10, 2020
Modèle Français 0.6 pour DeepSpeech v0.7, v0.8, v0.9 Français (fr)	11	8478	July 5, 2021
Modèle français 0.2 pour DeepSpeech v0.6 Français (fr)	2	972	October 13, 2019
Un premier modèle français Français (fr)	33	4635	September 28, 2019
Entraîner des modèles sur-mesure avec commonvoice-fr Français (fr)	8	1526	March 5, 2023

Modèle français 0.4 pour DeepSpeech v0.6

Related topics