Proposition d'ajout dans la base

Bonjour à toutes et tous,

Est il possible d’ajouter des livres audio ? Une association travail beaucoup pour les malvoyants en créant des milliers de livres audio en language naturel. De mémoire on parle de plus de 20 000 livres audio.

https://www.avh.asso.fr/fr/favoriser-laccessibilite/livres-audio

Je ne sais pas si certains d’entre vous ont déjà pris contact avec eux, je peux le faire, mais je ne sais pas s’il sera possible d’ajouter ces données (je suis trop récent dans cette communauté).

D’avance Merci,
Lilith42

Bonjour Lilith42,

Je n’ai pas trouvé la licence de leurs livres audio, mais puisque il faut obligatoirement s’inscrire sur leur site et que nous n’avons droit qu’à un nombre limité de téléchargements mensuels, j’imagine que tous leurs enregistrements sont sous copyright. Ce qui n’est pas compatible avec le projet Common Voice, qui demande à ce que tous les textes de départ et les enregistrements audio soient dans le domaine public ou sous licence CC0 :

« Pour assurer un maximum d’utilisation au jeu de données Common Voice, nous avons décidé d’autoriser uniquement du texte source sous une licence Creative Commons (CC0). Utiliser le standard CC0 rend la collecte de texte source plus difficile, mais assure que quiconque peut utiliser le jeu de données sans restriction ni autorisation de Mozilla. De plus, vous voulons que le jeu de données multilingue soit le plus utile à tous et à toutes, que ce soit des chercheurs et chercheuses, des universités, des startups, des gouvernements, des organisations à but social et toute personne amatrice. »

Maintenant, comme il s’agit de bénévoles qui semblent avoir à cœur de produire du contenu pour les aveugles et malvoyants, tu pourrais peut-être leur parler du projet et les inviter à y contribuer.

Je peux me tromper, mais j’imagine qu’à notre époque, la reconnaissance vocale doit déjà être particulièrement utile aux personnes ayant cet handicap, et que ça le sera sans doute de plus en plus au fil du temps. Ils pourraient donc être réceptifs aux objectifs du projet :slight_smile:

Qu’est-ce que tu entends précisément par « ajouter des livres audio ? » Rajouter le son dans Common Voice ? Pour plein de raisons techniques, c’est difficile et une mauvaise idée.

Comme @Okki le signale, s’ils acceptent de mettre à disposition le texte dans une licence compatible, celui-ci pourrait être rajouté pour que des gens s’enregistrent sur Common Voice.

Bonjour et merci pour vos réponses,
@Okki je pense en effet que le projet peut être vu par eux du côté utile pour leur communauté et indépendant ce qui est un plus. Par contre en effet pour les licences il faut que je les contact.
@lissyx Je ne comprend pas en quoi ce serait une idée mauvaise et difficile…

Peux tu me donner plus d’info, je ne connais pas bien le couple texte/voix utilisé par Common Voice ni comment il se présente.
Mais de mémoire leur livre audio peuvent afficher le mot exacte en cours de prononciation sur leur appli. Il y à donc forcément une synchro voix/texte.
Peut être qu’en découpant des extraits de 10 secondes c’est jouable et il “suffirait” de les intégrer à l’outil de vérification par la suite pour potentiellement retirer les morceaux défaillants.

Pour ce qui est du texte leur bibliothèque intègre des livres qui sont dans le domaine publique, ce n’est clairement pas compliqué de les récupérer et de les intégrer, mais je ne sais pas si common voice France manque de texte.
De mémoire la BNF met ces texte à dispos dans une licence libre (peut être pas CC0 a contrôler)

En tout cas je suis preneur de plus d’infos pour mieux comprendre :slight_smile: encore merci de m’avoir déjà répondu avant !

C’est pas le rôle de common voice de regrouper des jeux de données externes.

C’est une très bonne initiative de faire un jeu de données avec et je serais content si ça se fait de l’inclure dans un modèle français si je trouve le temps de m’en occuper.

@Lilith42 Pour expliciter un peu plus, c’est pas la première fois que ce genre de proposition nous parviens, et il y a plusieurs soucis :

  • intégrer des contributions audio + texte externe nécessite énormément de travail,
  • Common Voice se concentre sur un problème particulier, et ces projets externes peuvent avoir des contraintes et des façons de faire différentes qui sont pas compatibles,

Du coup, c’est pas si intéressant que ça en a l’air.

Ce qui peut l’être, comme déjà indiqué :

  • Si les gens sont OK à partager en CC-0, récupérer le texte et le soumettre pour Common Voice est déjà une très très grosse addition, en plus c’est beaucoup plus simple,
  • Si les gens sont OK à partager en CC-0, ils peuvent directement proposer un jeu de données qu’ils ont validé, c’est ce qui a été fait avec le ministère suite à la collaboration que j’ai eu avec eux https://data.economie.gouv.fr/explore/dataset/transcriptionsxml_audiomp3_mefr_ccpmf_2012-2020/

Rien n’empêche ensuite de profiter de ce nouveau jeu de données pour entraîner le modèle.

Comment sont les voix ? j’ai peur qu’il y ait peu de diversité dans les voix, puisque leur objectif c’est sûrement d’avoir de belles voix pour faire en sorte que la lecture soit agréable à écouter.

Mieux vaut en avoir trop que pas assez :slight_smile:

De ce que j’avais regardé, c’était pas compatible CC-0 et/ou très pénible à accéder automatiquement. Peut-être que ça a changé ?

@lissyx merci pour toutes ces infos !

Il faut donc plutôt que je me tourne sur le format d’un jeu de données si je veux récupérer des audiolivres. Après en effet ils sont très lisibles mais chaque donnée est bonne à prendre, de mémoire ils ont aussi beaucoup de lectrices ce qui manque cruellement dans les jeux de données que je trouve en Français.
As tu un lien vers un tuto ou un wiki qui me permettrait d’apprendre la structure de ces jeux de données et comment en créer ?

Pour les textes je vais me renseigner auprès de Galica de la BNF.
Je vais aussi toquer chez Framasoft, de mémoire une partie de leur contenu est CC0 y a peut être du texte à récupérer (Articles, documentations, …) tout un lexique.

Encore merci pour les infos et je comprend mieux tes remarques :slight_smile:

Beaucoup, on parle de combien de voix différentes ?
Encore une fois, c’est important dans le modèle final, et donc une nouvelle source de donnée est intéressante :slight_smile:

Construire un jeu de données, tu fais comme tu veux :slight_smile:

Je sais qu’on a déjà importer des choses de chez eux, va falloir que tu vérifies sur https://github.com/common-voice/commonvoice-fr/blob/master/CommonVoice-Data/framabook.py