✅ Campaña de validación de junio: ¡Mejora la próxima versión del conjunto de datos!

Hola a todos,

:rocket: Me alegra compartir que estamos preparando todo para nuestra próximo versión del conjunto de datos de Common Voice y queremos asegurarnos de que podamos incluir tantas horas validadas como sea posible para aumentar su calidad y utilidad.

:spiral_calendar: Nuestro objetivo es publicar los últimos datos aproximadamente el 30 de junio de 2020. El lanzamiento de un nuevo conjunto de datos requiere cierta preparación y el equipo de Common Voice planea iniciar la compilación de los últimos datos el 22 de junio de 2020. Esta se considera la fecha límite para que los datos grabados y validados se incluyan con la próxima versión del conjunto de datos.

:white_check_mark: La mayoría de los idiomas tienen una cantidad significativa de horas registradas que todavía esperan ser validadas. Queremos alentar a todos a enfocar vuestras energías y comunidades en validar tanto como sea posible antes del 22 de junio. Esto permitirá que estas horas se publiquen en la última versión del conjunto de datos.

:information_source: Esto también ayudará a los investigadores y a las personas que entrenan modelos de reconocimiento de voz a tener más datos a su disposición para entrenar modelos iniciales en sus idiomas. También ayudará a atraer a más personas para que participen en el proyecto.

¿Cómo puedes ayudar?

:ear: Si ya estás participando en Common Voice, enfoca tu tiempo en escuchar y establece una meta personal en tu perfil para tener un recordatorio al respecto.

:closed_book: Lee y comparte las siguiente guía de la comunidad para saber cómo validar mejor las voces.

:speaking_head: Habla con tu comunidad, explica por qué es importante tener tantas horas validadas como sea posible para fines de junio. Cuéntales sobre cómo crear un perfil en el sitio, establecer un objetivo personal y revisar la guía de validación (es posible que queráis localizar este tema y guía, y luego publicarlo en este discourse en español).

:robot: Fomenta actividades divertidas para que las personas validen unos minutos todos los días y hagan ruido en sus comunidaded y redes sociales.

¡Gracias a todos por vuestras colaboraciones!

Tema original en inglés

1 Like

Por dar un poco de contexto en español

Tenemos 249 horas pendientes de validar (uno de los idiomas con un porcentaje pendiente tan algo), si fuéramos capaces de validar todo lo que hay grabado hoy, podríamos empezar a entrenar modelos en español con más de 500 horas y ver qué tal se comportan :smiley:

Sólo quedan 10 días, ¿le damos un empujón final?

:robot: Recordatorio: Queda una semana para el 22 de junio, fecha límite para validar el mayor número de voces posibles en Common Voice para que sean incluidos en la próxima versión del conjunto de datos en julio.

:loudspeaker: Por favor, intentemos que todas nuevas comunidades lo sepan e ¡intentemos dar un empujón a las validaciones esta semana!

¡Muchas gracias a todos por vuestras aportaciones!