Deepspeech & base de donnée

Les 2Go de données correspondent, une fois importées, à ~40h au total, c’est très largement insuffisant, oui.

Tu devrais regarder https://github.com/Common-Voice/commonvoice-fr/blob/master/DeepSpeech/Dockerfile.train.fr

Je suis encore en train de faire des réglages de paramètres, mais ça permet d’entraîner un modèle par dessus l’anglais (donc pour le moment, on est coincés à devoir réutiliser l’alphabet anglais), et ça donne des résultats plus acceptables. J’ai documenté ça Un premier modèle français

1 Like