Hola a todos,
Me alegra compartir que estamos preparando todo para nuestra próximo versión del conjunto de datos de Common Voice y queremos asegurarnos de que podamos incluir tantas horas validadas como sea posible para aumentar su calidad y utilidad.
Nuestro objetivo es publicar los últimos datos aproximadamente el 30 de junio de 2020. El lanzamiento de un nuevo conjunto de datos requiere cierta preparación y el equipo de Common Voice planea iniciar la compilación de los últimos datos el 22 de junio de 2020. Esta se considera la fecha límite para que los datos grabados y validados se incluyan con la próxima versión del conjunto de datos.
La mayoría de los idiomas tienen una cantidad significativa de horas registradas que todavía esperan ser validadas. Queremos alentar a todos a enfocar vuestras energías y comunidades en validar tanto como sea posible antes del 22 de junio. Esto permitirá que estas horas se publiquen en la última versión del conjunto de datos.
Esto también ayudará a los investigadores y a las personas que entrenan modelos de reconocimiento de voz a tener más datos a su disposición para entrenar modelos iniciales en sus idiomas. También ayudará a atraer a más personas para que participen en el proyecto.
¿Cómo puedes ayudar?
Si ya estás participando en Common Voice, enfoca tu tiempo en escuchar y establece una meta personal en tu perfil para tener un recordatorio al respecto.
Lee y comparte las siguiente guía de la comunidad para saber cómo validar mejor las voces.
Habla con tu comunidad, explica por qué es importante tener tantas horas validadas como sea posible para fines de junio. Cuéntales sobre cómo crear un perfil en el sitio, establecer un objetivo personal y revisar la guía de validación (es posible que queráis localizar este tema y guía, y luego publicarlo en este discourse en español).
Fomenta actividades divertidas para que las personas validen unos minutos todos los días y hagan ruido en sus comunidaded y redes sociales.
¡Gracias a todos por vuestras colaboraciones!