Cuando estará disponible?

juanmol · December 12, 2019, 12:10pm

Hola!, hace algún tiempo que no entraba en common voice, y me surge la duda ¿ya es usable? y ¿cómo se usa? es decir, ya puedo integrar las voces en español con algún motor como PocketSpinx?

nukeador · December 12, 2019, 12:14pm

Hola y ¡bienvenido a la comunidad!

Cada varios meses actualizamos los datasets para que puedan ser descargados desde:

https://voice.mozilla.org/es/datasets

A principios de enero queremos ver si podemos publicar una nueva versión con todos los datos recopilados la segunda mitad de 2019.

Estos datasets se pueden usar con motores de STT como DeepSpeech para entrenar modelos

La idea es que con el tiempo, el equipo de #deep-speech vaya entrenando y publicando modelos, de momento están centrados en hacerlo primero con el inglés, que es donde más horas tenemos.

Un saludo.

juanmol · December 12, 2019, 1:40pm

hay un minimo de horas necesarias para generar el primer modelo en español? cuantas quedan?

nukeador · December 12, 2019, 2:15pm

Lo que nos dicen los expertos es que para tener un modelo básico, se necesitan al menos 2000 horas validadas y más de 1000 voces diferentes.

Actualmente en español:

Hablantes 8627
Horas validadas 132h

https://voice.mozilla.org/es/languages

juanmol · September 9, 2020, 9:46am

Hola, hay videos en youtube como https://www.youtube.com/watch?v=cDU6Oz1bNoY&t=8s&ab_channel=NeilStoker en el que parece que se puede usar con buenos resultados. En el mismo comentario del video viene el enlace al git del TTS. Lo he leido y parece que con Español es usable el TTS, teoricamente. Lo instalo todo pero … no veo como le puedo indicar una frase para que la sintetice ¿como puedo usar el modelo español? me interesa básicamente sintetizar frases desde la consola de linux ¿es posible?
Saludos!!

Topic		Replies	Views
Nuevo conjunto de datos de mitad de año: ¡Más datos, más idiomas! Español (es)	10	2186	July 6, 2019
Using Common Voice data with DeepSpeech Common Voice	11	7600	August 21, 2021
Nueva version del dataset: 220 horas en español, más de 4200 en todos los idiomas Español (es)	1	1789	January 15, 2020
Timeline for releasing the DeepSpeech models trained with the Common Voice data Common Voice dataset	1	1375	June 23, 2018
Smaller commonvoice dataset Common Voice learning , feedback	0	1216	September 2, 2020

Cuando estará disponible?

Related topics