Volumen de voces y objetivos [se necesitan ideas]

Hola,

Ahora que ya tenemos suficientes frases en español para potenciar grandes aportaciones a la donación y validación de voces, me gustaría abrir este tema para hacer un poco de tormenta de ideas sobre cómo atacar el reto que tenemos delante.

Actualmente hay 45 horas validadas en español, de las cuales unas 29 de 38 fueron hechas antes del import de wikipedia y contienen repeticiones de la misma frase, lo cual no es usado por los algoritmos de aprendizaje de Deep Speech.

Esto nos da unas 15 horas útiles validadas en español actualmente.

Como ya hemos comentado varias veces, se necesitan como mínimo 2000 horas para entrenar un modelo básico que sepa reconocer la voz.

Ahora, si queremos aumentar la cantidad y duración de las aportaciones de voz, así como de las validaciones, ¿qué ideas se os ocurren para conseguir que grandes cantidades de gente donen el máximo posible? Tened en cuenta que cada frase tarda en grabarse unos 5 segundos, lo cual nos hace necesitar al menos 1,8M de clips grabados y validados.

Algunas preguntas para iniciar este tema:

  • ¿Cómo podemos incentivar grandes eventos (>80 personas) donde se donen y validen al menos 15 minutos por persona?
  • ¿Cómo podemos hacer que estos eventos sigan ocurriendo de forma regular?
  • ¿Qué incentivos podemos ofrecer a la gente para que participe?
  • ¿Cómo podemos involucrar organizaciones y empresas para que ayuden con esto también e involucren a sus empleados?
  • ¿Qué incentivos podemos ofrecerles?

Un ejemplo: 10 eventos de 80 personas cada uno, donando y validando 15 minutos de voz por personas, nos darían algo menos de 200 horas.

¡Gracias a todos por vuestras ideas!

1 Like

En la mayoria de eventos las personas se mueren por tener un sticker o swag de Mozilla/Firefox. Podríamos hacer actividades donde al donar o participar en Common Voice se les done eso, así tenemos algo a cambio y creo que muchas personas aceptarían, ademas que probablemente les llame la atención y participe mas adelante en el proyecto.

En la comunidad WordPress hacen un translation day donde se ponen de acuerdo en todo el mundo para reunirse y hacer traducciones, se puede organizar algo similar para que las personas de habla hispana se reunan en un mismo dia y colaboren con horas de audio

1 Like

Es interesante la idea, siempre y cuando el coste del sticker/recompensa sea muy bajo.

Ya que hay que tener en cuenta que si pagas a una empresa por el crowdsourcing, el precio de una hora de voces equivaldría a unos $18-20, y validar una hora de voces otros $18-20.

Si en un evento de 80 personas se consiguen generar 1200 minutos validados (20h a 15 minutos por persona), creo que tendría sentido gastar $10-20 para producir stickers.

Seria bueno también validar con un par de pruebas en el mundo real esta teoría de que las recompensas equivalen a más participación, no es lo mismo que donen y validen 15 minutos por persona, que solo 1-2 minutos.

Si la gente dedica 2 minutos a donar y 2 a validar, el evento generaría 2,6 horas, que tienen un coste de $48 en mercado. Si tuviéramos que pagar las 2000hrs con stickers el coste serían unos $6600.

1 Like

Se me ocurren que esta clase de eventos se puede plantear con un salón cerrado para estar grabando y validando grabaciones donde las personas puedan pasar a sentarse y hacer uso de la red local para ello tambien es bueno facilitar audifonos y microfono para los que quieran grabar y audifonos para los que solo quieran validar. Junto a ello un stand informativo fuera del salón para evitar la mayor cantidad de ruido dentro de donde se realicen las grabaciones para que la gente llegue se puede hacer una rejilla de charlas o taller en un tercer espacio donde se traten temas sobre aprendizaje de maquina e inteligencia artificial con gente local y que ellos mismos o el maestro de ceremonia entre cada actividad recuerde a los asistentes de los beneficios y avances del salón de grabación y que pasen al stand a informase del proceso de common voice.

Se me ocurre tambien que seria diveritdo en este formato tener un tipo de conteo al estilo teletón de: “hemos recolectado tanto, pasa y permite que lleguemos a la meta”, estas cosas se ponen emocionantes cuando es asi.

Con respecto a la motivación lo del sticker queda bien además podriamos pensar en camisetas para la gente que se quede por mas tiempo algo asi como premio por escala de donación el swag va sumandose.

Creo que a las empresas les podemos llegar con algun estudio de mercado que les deje ver los beneficios o el ahorro que puede significar para sus invertir en common voice para optener esa base de datos mas el respectivo aparecimiento del logo de su empresa como un inversionista en el proyecto, si se puede hacer una carta validando su donación algunas empresas lo ven atractivo ya que pueden declararlo y ahorrarse en impuestos, recuerden que con empresas hay que ser bien directos en el factor economico.

Con las universidades hay que dirigirse a los departamentos de investigación quienes pueden tener mucho mas interes en la inversión y seguimiento del proyecto ya que los costos con respecto a invertir en common voice y llevar su propia recolección de datos tienen una diferencia marcada ademas para los centro de investigación el reconocimiento de colaboración en proyectos de esta indole son interesantes.

Son algunas ideas…

La idea de involucrar empresas es muy buena (diría que mejor que las Universidades, salvo que se consiga un buen trato con alguna). Yo soy socio en una pequeña empresa de informática donde estuvimos de acuerdo en hacer difusión al proyecto Common Voice durante toda la semana pasada mediante redes y blogs (porque el proyecto nos interesa, no esperamos nada a cambio, pero la mayoría de las empresas no siempre piensan igual). Nuestro alcance no es muy elevado, pero estoy convencido de que cualquier empresa de Software o Tecnología estará feliz de colaborar en un proyecto de Mozilla si a cambio aparecen en una sección de “Instituciones que han Contribuido” (o algo similar, lo que suele denominarse como “Embajadores”). No sé, igualmente, en que estado actualmente Mozilla tiene interés de tener una sección así, eso ya lo dejo a quien corresponda. Por supuesto que esto a priori no genera horas de grabación en masa (salvo que se llegue a un acuerdo con dichas empresas). Pero lo que si genera difusión, y en el estado actual del proyecto parece ser una gran estrategia. Al menos consideraría tener un formulario de contacto para dichas instituciones.

Después, respecto a conseguir la mayor cantidad de donaciones posibles, la idea de la interfaz con tanta “gamificación” es un punto a favor, y yo lo seguiría trabajando. Esto posiblemente vaya mejor en otro foro de discución, así que seré breve. Sería ideal tener una tecla asignada a grabar en lugar de tener que hacer click en un botón (desconozco si existe, de ser así no está indicada). Y otra cosa importante, para los que estamos un rato largo validando los audios, hace falta una opción (que puede estar en configuración) para disparar los audios automáticamente luego de apretar “Si” o “No” (del mismo modo que está la configuración para desactivar el cartel al final de los 5 audios). Parece algo banal, pero reducir la acción de validar de dos clicks o solamente uno lo va a hacer mucho más ágil para quienes lo deseen.

Saludos.

3 posts were split to a new topic: Mejoras en la experiencia de la app