Pautas de validacion de las frases español

Buenos días aunque hay un tema en ingles me gustaría que aportásemos aquí todo lo necesario en español para que todos pudieramos enterarnos que se puede validar cual es útil y cual no.

Basicamente lo que he leído hasta ahora es
que la frase tiene que estar correctamente leída no pueden ponerse palabras que no existen ni añadir o que falten letras .
la lectura debe ser natural ,velocidad normal
ni muy rapida ni muy lenta. El volumen del sonido ni demasiado alto que llegue a distorsionar ni tan bajo que no se oiga ,sin sonido por supuesto no vale. Se admiten sonidos o ruidos pequeños de fondo que no impidan nuestra comprension. Se admiten todo tipo de acentos y voces ya que la idea es que el algoritmo que se desarrolle sea capaz de entender y hablar todo tipo de voces y acentos. Si alguien tiene algo mas que aportar que lo vaya añadiendo al foro en ingles esta aqui

Hola Fernando,

Te muevo el tema de momento a Mozilla México porque no tenemos un canal en español para Common Voice en este foro y queremos mantener en inglés la categoría principal.

Un saludo.

vale ok no me importa donde este alojado gracias

Si algun graciosillo de los que sueltan tonterias llega a este post me gustaria decirle que una gracia de vez en cuando puede resultar hasta divertida. pero si queremos hacer algo que merezca la pena cortaros un poco que dais mucho trabajo gracias

Me gustaría entender la motivación de este mensaje. Si te has encontrado con experiencias como las que describes en este discourse me gustaría saberlas, ya que el sistema de moderación comunitaria debería evitar que sucedan, además que un comportamiento disruptivo va en contra de nuestras pautas de participación comunitaria.

https://www.mozilla.org/about/governance/policies/participation/

Un saludo.

Pues a la hora de validar las grabaciones hay gente que dice cosas que no pone en el texto, sencillamente dice lo que le da la gana o no calibra el microfono y se oye tan bajo que es inapreciable aunque este caso se podria considerar involuntario o directamente no se oye nada . En fin soltar una gracieta de vez en cuando igual hasta nos reimos todos pero cuando este comportamiento es repetitivo deberia haber algun moderador que lo limitase creo desconozco el sistema del que me hablas pero no funciona del todo
un saludo

Si te refieres a las grabaciones de voz en http://voice.mozilla.org/es/listen estaría bien saber si esto ocurre habitualmente para identificar qué usuarios están haciéndolo y contactarles o bloquearles si lo hacen voluntariamente.

En general la validación comunitaria debería evitar que estos clips se validaran, ya que si dos personas votan no el clip se va al “cementerio de clips”.

He pedido la creación de una subcategoría para las conversaciones en español de Common Voice, muevo la conversación ahí :smiley:

1 Like

He notado lo mismo que menciona @Fernando, hay varios que no saben que su micro está muy bajo y apenas se escucha algo o de plano no dicen nada.

Si no se entiende hay que votar no. Podemos observar si hay usuarios en la lista con un % muy bajo de aprobaciones e intentar contactar con ellos.

Un saludo.

Bueno esta es una pregunta para nukeador , que hacer cuando una persona acapara todas las frases , repite una y otra vez las mismas , ademas tiene un ruido molestisimo en el microfono como un chasquido, la verdad es que no se que hacer porque al hombre se le ve ilusionado no vocaliza bien aunque se le entiende si hiciera pocas seria admisible pero solo esta el hace muchisimas frases .

Normalmente yo intento escuchar sin leer la pantalla, luego miro y si entendí lo mismo, valido.

Sería bueno mirar en la lista de usuarios del dashboard si en español hay alguno con un ratio muy alto de rechazados, y ver si podemos contactar.

Vale gracias , algo haré . Yo no soy programador y no entiendo mucho el proceso posterior de las bases de datos bueno lo unico lo de la normalizacion que creo es igualar el nivel del sonido de todos los audios, pero entiendo que las muestras de voz tienen que ser variadas para que el sistema funcione si una persona acapara el 80 por ciento de los audios y con un nivel no muy correcto no creo que salga nada bueno de ahí .

Además que no es útil tener decenas de horas de una misma voz. Con que una persona grabe unos 260 clips es más que suficiente, lo ideal después es seguir ayudando en la validación y conseguir voces más diversas que participen.

1 Like