Vous pouvez le trouver, avec les paramètres d’entraînement, la sortie des tests et les détails sur le volume et les sources de données sur :
Les essais de la part de certains contributeurs montrent une amélioration dans la qualité des transcriptions par rapport à la dernière release 0.5.2 réalisée cet été, grâce à l’ajout des 300h du ministère (champs lexical différent, son provenant de conférences donc dialogues, plus grande variété de genres).
lissyx
((slow to reply) [NOT PROVIDING SUPPORT])
4
Normalement toutes les sources de données utilisées le permettent, et le processus de construction du modèle ne devrait pas engendrer de contamination ; la question est précisée dans https://github.com/common-voice/commonvoice-fr/issues/149
Je cherchais des modèles FR et je suis tombé ici.
J’ai testé le modèle sur mon projet mais pour le moment, les sous-titres de Youtube sont plus efficace…
Qu’est ce qu’on peut faire pour améliorer les modèles ? Common Voice ?
lissyx
((slow to reply) [NOT PROVIDING SUPPORT])
10
Sans plus d’information, difficile à dire. Vu l’erreur, ça sent le fichier incorrect, ou incompatible, mais la version de deepspeech est bonne apparemment.