Faire un système simplifié = « Common Voice Kids »?

okaaay. Je ne dit pas ça. Alors dommage que tout ne puisse pas avancer plus vite… Déjà, ça existe, c’est bien.

mettre en place le nécessaire pour avoir le filtrage approprié est en cours de travail : la campagne “premier segment” actuelle explore le mécanisme, mais c’est pas encore vraiment industrialisé si j’ai bien compris

C’est le point clef (en relation par ailleurs avec Proportion de noms propres à consonnance étrangère)

Il faut plus de flexibilité pour permettre à l’utilisateur de choisir un set ordonné de phrases. Typiquement : un livre pour enfant.
Car pour un enfant de sept ans c’est un excellent passe-temps : C’est drôle et valorisant et ça permet la pratique de la lecture. Mais les phrases actuelles sont clairement inadaptées et frustrante.

Exemple typique : L’enfant choisi “Voyage au centre de la terre”, et le lit phase après phrase. Certaines phrases sont inadaptées à la collecte, mais ce n’est pas grave. Elles pourront très bien être ignorées.

  • Trouver des sources textuelles n’est pas un problème.
  • Trouver des enfants non plus.
  • Adapter la logique de “campagne”

Première question ou se trouvent les pull-requests relatives à la “first segment campaign” ?

Il s’agirait alors de s’en inspirer pour un mode “Lire un livre pour enfant”.

1 Like

Merci pour cette information. Nous recherchons depuis un moment des corpus contenant des enregistrements de voix d’enfants afin d’améliorer nos algorithmes d’aide à la décision médicale au sein du Samu. Jusqu’à présent, nous rencontrons encore de grandes difficultés avec les voix d’enfants :slight_smile: