Deepspeech & base de donnée

yasine.nifa · June 12, 2019, 7:28am

Bonjour,

J’ai entrainé le deepspeech avec 2Go de données (donnée en français proposée par Mozilla) et 3750 epochs mais à la fin j’ai pas obtenu de bonne résultats.

Est-ce que c’est pas suffisant ?

lissyx · June 12, 2019, 8:06am

Les 2Go de données correspondent, une fois importées, à ~40h au total, c’est très largement insuffisant, oui.

Tu devrais regarder https://github.com/Common-Voice/commonvoice-fr/blob/master/DeepSpeech/Dockerfile.train.fr

Je suis encore en train de faire des réglages de paramètres, mais ça permet d’entraîner un modèle par dessus l’anglais (donc pour le moment, on est coincés à devoir réutiliser l’alphabet anglais), et ça donne des résultats plus acceptables. J’ai documenté ça Un premier modèle français

lissyx · June 12, 2019, 8:09am

@yasine.nifa Normalement avec mon Docker tu dois pouvoir reproduire le même modèle que moi. Tu as quoi comme matériel à disposition pour entraîner ?

yasine.nifa · June 12, 2019, 8:22am

J’ai deux PC
le premier :
mémoire : 16 Go
Processeur : Intel® Core™ i7-7700 CPU @ 3.60GHz × 8
carte graphique : GeForce GTX 1070/PCIe/SSE2
Typr de système d’exploitation : 64-bit
Disque : 783.5 Go

Le deuxième PC :
Mémoire : 16Go
Processeur : Intel® Core™ i7-7700 CPU @ 4.20GHz × 8
Carte graphique : GeForce GTX 1080/PCIe/SSE2
Type S.E : 64 bits
Disque : 239.3 Go

lissyx · June 12, 2019, 11:07am

ok, avec le docker ça risque de te prendre un peu de temps. Avec le jeu de données actuel, Training Speech + Lingua Libre + Common Voice, je suis à 15 min par epoch, et il m’en faut entre 15-20 par dessus le modèle anglais. J’ai deux RTX2080Ti.

Topic		Replies	Views
Modèle Français 0.6 pour DeepSpeech v0.7, v0.8, v0.9 Français (fr)	11	8372	July 5, 2021
Modèle français 0.4 pour DeepSpeech v0.6 Français (fr)	7	5498	March 29, 2021
Modèle français 0.2 pour DeepSpeech v0.6 Français (fr)	2	960	October 13, 2019
Un premier modèle français Français (fr)	33	4622	September 28, 2019
Deepspeech français DeepSpeech learning	2	3886	May 19, 2022

Deepspeech & base de donnée

Related topics