Discussions Common Voice / DeepSpeech en Français

Bien sûr ^^
Je tourne sous linux disco dingo 19.04, j’utilise Firefox Quantum 68.0 (64 bits).
J’ai activé le microphone et les hauts parleurs, pour un site comme youtube j’ai bien du son, pour enregistrer ma voix sur Common voice ça fonctionne nikel puisque j’arrive à réécouter mes enregistrements, mais bizarrement pour écouter les échantillons des autres je n’ai aucun son…
Je me contenterai d’utiliser l’app iOS pour le moment :slight_smile:

Kruons, il semblerait que tu n’ais pas installé de quoi lire le mp3 sur ton système. Habituellement sur Ubuntu, il faut installer libavcodec58.

Les derniers brevets sur le mp3 ont expiré récemment, on va pouvoir s’affranchir des décodeurs système, mais on a pas encore implémenté le support.

2 Likes

Merci pour votre aide :slight_smile:
Je viens de voir votre message mais j’ai réussis à régler le problème en cherchant une solution à la lecture de certaines vidéos Youtube qui ne se lisaient pas sur mon navigateur, j’ai donc installé FFMPEG par “apt://ffmpeg” et j’ai eu l’idée de réessayer l’écoute sur Common Voice et effectivement je parviens maintenant à entendre les échantillons!

Je vais aussi installer libavcodec58 puisque vous me le conseillez, par simple mesure de prévention on ne sais jamais ça pourrait servir :smiley:

Merci beaucoup, @lissyx & @padenot je vous souhaite que des bonnes choses et une bonne continuation pour faire avancer tous ces fabuleux projets ^^

PS: ce message a été écris 2h après votre réponse mais posté bien après (24h) à cause de la limite de posts et messages journaliers que j’ai visiblement atteinte!

Heureux que ça fonctionne maintenant, et merci pour tes encouragements!

Pour être précis, libavcodec58 est une des bibliothèques derrière ffmpeg, donc normalement tu devrais déjà l’avoir.

2 Likes

Bonjour à toutes et tous,
J’ai remarqué que nous avions un vaste choix d’accent en français (par exemple nous pouvons choisir Français du Royaume Uni - ce qui n’est pas possible en anglais par exemple)
Cependant, il n’est pas possible de choisir un accent de la France métropolitaine, alors même que nous avons sur notre territoire une forte variabilité sonore dans l’expression orale du français. Un habitant du Lot et Garonne n’aura pas la même diction qu’un habitant du Nord ou que des Bouches du Rhône ou de l’Alsace.
Je pense qu’il pourrait être intéressant de pouvoir avoir ce choix parmi le choix des accents français (il est vrai que bcp de locuteurs métropolitains ont perdu leur accent régional mais ce n’est pas le cas de tout le monde et il y a encore de fortes variabilités géographiques)
Voilà c’est tout pour moi
Yourigan

2 Likes

C’est quelque chose dont l’équipe Common Voice est au courant depuis longtemps, et ils travaillent pour améliorer ça, j’espère que ce sera pour bientôt public.

2 Likes

Super,
Merci bcp pour l’information ! En espérant que ça arrive prochainement

Bonjour, je suis nouvelle sur le forum et ne vois pas comment ouvrir un ujet, donc je me permets de “répondre” à votre message.
J’ai le même problème que Kruons décrit, mais avec un iMac: je peux enregistrer, m’entendre, mais impossible de valider les autres enregistrements: silence abyssal. J’avais essayé de contacter Common voice par mail il y a un an au moins et n’avais reçu aucune réponse. Aujourd’hui j’ai de nouveau contacté par mail, puis suis tombée sur cette discussion.
Auriez-vous une idée, une explication ou un conseil à me donner? Merci. J’ajoute que j’ai une connexion fort lente et qu’il faut parfois beaucoup de temps pour parvenir à obtenir la page opérative de Common voice.

J’ai bien peur que ce soit encore un autre soucis, si tu arrives à t’entendre je ne penses pas que ce soit un problème de codec, mais ça pourrait être le cas. Sur macOS on va probablement dépendre des codecs du système. Du coup il faudrait d’abord vérifier que tu arrives à jouer du MP3 dans Firefox.

Sinon, c’est peut-être juste la lenteur et les clips ne sont pas encore téléchargés ?

Merci pour cette réactivité ! Je lis les mp3 de youtube dans Firefox sans problème, mais bon… les voies de l’osX sont impénétrables.
Pour la vitesse de réception: j’ai essayé d’attendre assez longtemps, mais ça ne donne rien non plus. Suis-je la seule à avoir ce type de problème avec un mac? J’ai du mal à suivre un forum en anglais, du coup je ne sais pas si on en parle dans les discussions antérieures.

Pas sûr que YouTube diffuse en MP3 justement :confused:

En tout cas la seule à l’avoir remonté.

Quelles versions de Firefox et de macOS ?

Effectivement quand je cherche sur le net il est fait état par Mozilla d’éventuels problèmes de lecture de mp3 sous Firefox Mac.
J’ai aussi essayé rapidement avec Safari et avec Opera, sans plus de succès, mais si c’est lié à l’os…
MacOs 10.13.6
Firefox Quantum 69.0.1

Est-ce que tu peux essayer https://alexandre.alapetite.fr/doc-alex/html5-audio/index.en.html, la section du bas, tu as différents formats ?

Ça doit faire un bruit de numérotation téléphonique

Bonjour,
Je vous ai répondu directement par retour mail, je pensais que ça apparaitrait aussi sur le forum. Ne voyant rien venir je copie ci-dessous ma réponse (je ne sais si vous l’avez reçue). Si c’est un doublon excusez-moi.

j’ai fait tous les tests de la page, à toutes les vitesses, et tous fonctionnent bien (en 2s on se croirait près d’une mare à crapauds quand les sons se superposent…).
Par acquis de conscience (suite à la vérification des permissions Firefox pour le site, cf ci-dessous) j’ai essayé de nouveau le module d’écoute et de validation de voice, mais c’est toujours pareil: nada.

En tous cas merci de vous pencher sur mon problème. J’ai reçu hier aussi une réponse en anglais suite au mail que j’avais envoyé directement à partir du site, mais la personne qui m’a répondu (lsaunders at mozilla) me dit utiliser elle-même un iMac aussi, sans avoir ce problème. Elle ne voyait pas ce qui pouvait motiver ce silence et m’a demandé de vérifier les permissions microphone et popup (ce que j’ai fait). Mais je pense que si le problème avait été là je ne pourrais pas m’enregistrer moi-même ni m’entendre avant expédition des enregistrements.
Elle me demandait aussi s’il n’y avait pas eu de réponse à mon problème sur “github”, mais ça ça dépasse un peu mon entendement (c’est les forums?)

DanJu

Non j’ai rien reçu

Donc ceux en MP3, donc c’est pas ça le soucis.

Github c’est https://github.com/mozilla/voice-web/issues mais si t’es pas à l’aise avec l’anglais ça va être compliqué

Bonjour,
Je voudrais faire de la transcription audio dans le cadre de la gestion de crise ( par exemples catastrophes naturelles). Dans ce contexte, on utilise souvent des acronymes, par exemple le nom des routes (l’autoroute A6, la RN98 etc…)
J’utilise deepspeech et le modèle fr de common voice (v0.6) que je fais tourner avec mic_vad_streaming.
Cela fonctionne très bien sur windows et linux. La vad fonctionne je transcris correctement l’ensemble des phrases simples (sans entités nommées)
J’aimerai justement retranscrire des entités nommées comme des noms de rue, de bâtiments, et les acronymes.
Comment puis-je résoudre ce problème (: retranscrire des entités nommés et des acronymes) ?
Pour le moment j’ai écarté l’option d’entrainer mon propre modèle car je n’ai pas les ressources nécessaires (data, temps et moyens techniques) et je cherche d’autres solutions (si il en existe).

Merci bien

tu pourrais essayer d’augmenter le scorer avec tes données: https://mozilla.github.io/deepspeech-playbook/SCORER.html

et/ou potentiellement d’exploiter l’API HotWords: https://deepspeech.readthedocs.io/en/master/C-API.html#_CPPv413DS_AddHotWordP10ModelStatePKcf

Je partage tout à fait cet avis. Est-ce que l’équipe a avancé depuis 2019 sur ce thème?

Bonjour,
Je suis nouvelle venue sur common voice depuis environ une semaine. J’ai enregistré plus de 5000 clips et en ai écouté plus de 3000. C’est sans doute peu par rapport à nombre d’entre vous mais cela fait tout de même que je remarque quelques faiblesses dans les phrases proposées :

  • elles semblent souvent traduites de l’anglais/américain et la syntaxe est celle de ces langues et donc “bancale” en français ; exemple : une/des chose/s existe/ent au lieu de il y a ceci, cela ; ou bien : on dénombre telles choses (je ne suis pas sûre d’être tout à fait claire…)
  • les fautes de grammaire et d’orthographe sont de ce fait fréquentes
  • l’omission de dates, noms de lieux, mesures, superficie, distances, etc, sont légion ; pourquoi ?
    Je signale toujours ces lacunes.
    D’autre part, au vu du nombre de clips enregistrés avec un son déplorable ou une lecture impropre, ne serait-il pas judicieux de signaler au contributeur de toujours écouter ses 5 enregistrements, voire de les réenregistrer avant de les soumettre ? Cela économiserait un temps précieux à qui se donne la peine d’écouter/valider/invalider.
    Pardon de ne pas nommer directement la personne (je ne m’en souviens pas) qui a fait remarquer que certains contributeurs ne respectent pas les liaisons ; à mon avis, elles sont importantes car elles permettent notamment une compréhension plus précise de la phrase, de mieux apprécier l’orthographe, de renseigner sur le sujet (singulier ou pluriel), le verbe conjugué et les accords.

Je participe avec plaisir bien que de façon limitée car je suis nulle en informatique.
Bonne journée !

1 Like

Bonjour Catherine :slightly_smiling_face:

Tout d’abord, merci pour ton énorme participation :+1:

Les phrases en français proviennent majoritairement de Wikipédia, projet d’encyclopédie libre auquel n’importe qui peut contribuer. Ce qui explique la présence de fautes d’orthographe ou de phrases parfois bizarrement formulées.

Les nombres et les dates ont volontairement été supprimés, puisque ils pouvaient être lus de différentes façons. 90 sera lu quatre-vingt-dix par les Français mais nonante par les Belges. 1825 sera lu parfois mille huit cent vingt-cinq, mais parfois dix-huit cent vingt-cinq.

En ce qui me concerne, ça aura été une grosse erreur de les supprimer bêtement et simplement, plutôt que de les remplacer par leur version textuelle (il existe pourtant un programme pour ça). Mais on peut malheureusement difficilement revenir en arrière.

Sinon oui, je suis également d’accord que ça serait plus judicieux de prodilguer quelques conseils aux nouveaux contributeurs, plutôt que de les jeter directement dans le bain. Mettre plus en avant la présence du bouton Passer, histoire de passer une phrase qui ne nous plaît pas (ce que je fais systématiquement quand il y a des noms propres en islandais ou de je ne sais quel autre pays dont je n’ai strictement aucune idée de la prononciation), mettre en avant les Critères d’acceptation pour la validation d’enregistrements, qui sont pour le moment perdus sur le Discourse sur lequel peu de monde doit se rendre…

Pour la qualité des enregistrements, c’est un sujet qui revient souvent. Perso j’avais réécouté absolument tous mes enregistrements, mais j’imagine que ça sera trop lourd pour certains. Ça serait donc pas mal qu’il y ait au moins un outil de calibration / validation lors de la toute première participation, histoire de contrôler la qualité, le volume…

2 Likes