Cadenze dialettali

crash79 · November 26, 2019, 9:16pm

Ciao,

mi sono appena iscritto, perché mi sembra un progetto molto interessante. Il futuro è fatto di “big data” e tanto machine learning per analizzare questa enorme mole di dati (in applicazioni come questa, ma anche nella scienza, nella medicina, ecc.).

Detto ciò, non so poi come verranno analizzate tutte le voci, ma le diverse voci saranno caratterizzate da un diverso accento dialettale, che darà uno spettro molto ampio nella pronuncia di vocali o anche consonanti (ad esempio raddoppiate). Avete previsto la possibilità di aggiungere un’informazione del genere all’interno delle impostazioni del proprio account? Per un’analisi ancora più fine, completa e dettagliata, l’informazione sul tipo di inflessione dialettale potrebbe essere una “flag” che si affianca alle singole registrazioni. Questo potrebbe permettere: a) di addestrare meglio, b) di poter fare il divertente esercizio di addestrare voci nei vari dialetti.

Ciao,
C

Mte90 · November 27, 2019, 10:24am

Ciao per gli accenti è un lavoro che abbiamo avviato da tempo ma per l’italiano non è facile per niente.
Non esiste una classificazione valida a livello internazionale dei nostri accenti e quindi Mozilla non approva l’aggiunta di questa possibilità.
Qui puoi trovare la discussione portata avanti sul tema https://forum.mozillaitalia.org/index.php?topic=71223.0

Per la questione addestramento non si fa caso alla differenza di accenti visto che siamo agli inizi, per dire nemmeno il francese per realizzare il modello fa delle analisi differenti dell’accento anche se nel loro modello usano dataset con accenti diversi https://github.com/Common-Voice/commonvoice-fr/releases

Noi per il modello italiano siccome abbiamo poco materiale non ci stiamo preoccupando di questo fattore ma di trovare altri dataset audio per allenare di piú il modello https://github.com/MozillaItalia/DeepSpeech-Italian-Model/

Per maggiori domande se hai telegram puoi unirti alla comunità nazionale usando il @mozitabot nel gruppo home.