Deepspeech & base de donnée

Bonjour,

J’ai entrainé le deepspeech avec 2Go de données (donnée en français proposée par Mozilla) et 3750 epochs mais à la fin j’ai pas obtenu de bonne résultats.

Est-ce que c’est pas suffisant ?

Les 2Go de données correspondent, une fois importées, à ~40h au total, c’est très largement insuffisant, oui.

Tu devrais regarder https://github.com/Common-Voice/commonvoice-fr/blob/master/DeepSpeech/Dockerfile.train.fr

Je suis encore en train de faire des réglages de paramètres, mais ça permet d’entraîner un modèle par dessus l’anglais (donc pour le moment, on est coincés à devoir réutiliser l’alphabet anglais), et ça donne des résultats plus acceptables. J’ai documenté ça Un premier modèle français

1 Like

@yasine.nifa Normalement avec mon Docker tu dois pouvoir reproduire le même modèle que moi. Tu as quoi comme matériel à disposition pour entraîner ?

J’ai deux PC
le premier :
mémoire : 16 Go
Processeur : Intel® Core™ i7-7700 CPU @ 3.60GHz × 8
carte graphique : GeForce GTX 1070/PCIe/SSE2
Typr de système d’exploitation : 64-bit
Disque : 783.5 Go

Le deuxième PC :
Mémoire : 16Go
Processeur : Intel® Core™ i7-7700 CPU @ 4.20GHz × 8
Carte graphique : GeForce GTX 1080/PCIe/SSE2
Type S.E : 64 bits
Disque : 239.3 Go

ok, avec le docker ça risque de te prendre un peu de temps. Avec le jeu de données actuel, Training Speech + Lingua Libre + Common Voice, je suis à 15 min par epoch, et il m’en faut entre 15-20 par dessus le modèle anglais. J’ai deux RTX2080Ti.