Pautas de validacion de las frases español

Buenos días aunque hay un tema en ingles me gustaría que aportásemos aquí todo lo necesario en español para que todos pudieramos enterarnos que se puede validar cual es útil y cual no.

Basicamente lo que he leído hasta ahora es
que la frase tiene que estar correctamente leída no pueden ponerse palabras que no existen ni añadir o que falten letras .
la lectura debe ser natural ,velocidad normal
ni muy rapida ni muy lenta. El volumen del sonido ni demasiado alto que llegue a distorsionar ni tan bajo que no se oiga ,sin sonido por supuesto no vale. Se admiten sonidos o ruidos pequeños de fondo que no impidan nuestra comprension. Se admiten todo tipo de acentos y voces ya que la idea es que el algoritmo que se desarrolle sea capaz de entender y hablar todo tipo de voces y acentos. Si alguien tiene algo mas que aportar que lo vaya añadiendo al foro en ingles esta aqui

Hola Fernando,

Te muevo el tema de momento a Mozilla México porque no tenemos un canal en español para Common Voice en este foro y queremos mantener en inglés la categoría principal.

Un saludo.

vale ok no me importa donde este alojado gracias

Si algun graciosillo de los que sueltan tonterias llega a este post me gustaria decirle que una gracia de vez en cuando puede resultar hasta divertida. pero si queremos hacer algo que merezca la pena cortaros un poco que dais mucho trabajo gracias

Me gustaría entender la motivación de este mensaje. Si te has encontrado con experiencias como las que describes en este discourse me gustaría saberlas, ya que el sistema de moderación comunitaria debería evitar que sucedan, además que un comportamiento disruptivo va en contra de nuestras pautas de participación comunitaria.

https://www.mozilla.org/about/governance/policies/participation/

Un saludo.

Pues a la hora de validar las grabaciones hay gente que dice cosas que no pone en el texto, sencillamente dice lo que le da la gana o no calibra el microfono y se oye tan bajo que es inapreciable aunque este caso se podria considerar involuntario o directamente no se oye nada . En fin soltar una gracieta de vez en cuando igual hasta nos reimos todos pero cuando este comportamiento es repetitivo deberia haber algun moderador que lo limitase creo desconozco el sistema del que me hablas pero no funciona del todo
un saludo

Si te refieres a las grabaciones de voz en http://voice.mozilla.org/es/listen estaría bien saber si esto ocurre habitualmente para identificar qué usuarios están haciéndolo y contactarles o bloquearles si lo hacen voluntariamente.

En general la validación comunitaria debería evitar que estos clips se validaran, ya que si dos personas votan no el clip se va al “cementerio de clips”.

He pedido la creación de una subcategoría para las conversaciones en español de Common Voice, muevo la conversación ahí :smiley:

1 Like

He notado lo mismo que menciona @Fernando, hay varios que no saben que su micro está muy bajo y apenas se escucha algo o de plano no dicen nada.

1 Like

Si no se entiende hay que votar no. Podemos observar si hay usuarios en la lista con un % muy bajo de aprobaciones e intentar contactar con ellos.

Un saludo.

Bueno esta es una pregunta para nukeador , que hacer cuando una persona acapara todas las frases , repite una y otra vez las mismas , ademas tiene un ruido molestisimo en el microfono como un chasquido, la verdad es que no se que hacer porque al hombre se le ve ilusionado no vocaliza bien aunque se le entiende si hiciera pocas seria admisible pero solo esta el hace muchisimas frases .

Normalmente yo intento escuchar sin leer la pantalla, luego miro y si entendí lo mismo, valido.

Sería bueno mirar en la lista de usuarios del dashboard si en español hay alguno con un ratio muy alto de rechazados, y ver si podemos contactar.

Vale gracias , algo haré . Yo no soy programador y no entiendo mucho el proceso posterior de las bases de datos bueno lo unico lo de la normalizacion que creo es igualar el nivel del sonido de todos los audios, pero entiendo que las muestras de voz tienen que ser variadas para que el sistema funcione si una persona acapara el 80 por ciento de los audios y con un nivel no muy correcto no creo que salga nada bueno de ahí .

Además que no es útil tener decenas de horas de una misma voz. Con que una persona grabe unos 260 clips es más que suficiente, lo ideal después es seguir ayudando en la validación y conseguir voces más diversas que participen.

2 Likes

Buenas tardes, yo tambien me he topado con audios “raros” (como le ha pasado a Fernando) y los he validado como negativos, puesto que se trata de leer para dar a entender y no para hacerse el gracioso. Muchas voces grabadas son de niños, otros solo encienden el micro, no leen sino que se dedican a dar una charla amena de lo que le parece la frase.
Si son usuarios validados se puede hacer seguimiento, pero como el programa también incluye a los que no están registrados, pues ahí es donde veo difícil que se le haga seguimiento.
Saludos y gracias por el tema :wink:

Buenas tardes alguien sabe que hacer con frases que estan la mitad en ingles, ruso o yo que se.
Yo si tiene mas de la mitad de la frase en ingles directamente digo que no e informo sobre la frase y si la tengo que leer la salto y paso a otra .

Hay un botón para informar de esas frases. ¿tienes algunos ejemplos?

Debería ser extremandamente raro que haya frases en otros idiomas.

Un saludo.

bueno son sobre todo nombres aunque hay frases enteras. Si no sabemos español como para ir al ingles jajaja y digo no sabemos me incluyo no quiero parecer el sabelotodo del grupo pero hay frases con mas del 50 % lleno de nombres en ingles que cada uno pronuncia a su manera unos en ingles correcto otros en spanglis ejemplo: michael unos tal y como suena en español otros maiquel y lo correcto que creo es maicol siempre desde mi prudencia porque yo no soy experto en ingles
:grin:

Que haya algún nombre, lugar o marca en inglés está bien, ya que es interesante ver cómo lo pronuncia la gente, ya que puede salir en un contexto de frase en español.

“Vamos a cenar al Burger King”

1 Like

Creo que la pronunciación de palabras varía según el país. Porque en Alemania el nombre Michael se pronuncia Mishal. He escuchado a muchos decir mi nombre es Maikel (Michael), o en el nombre corto Mikkey (Maiki), Mickey (Miki).