Preguntas sobre el proyecto

Hola, estoy investigando un poco el proyecto y he colaborado un poco hoy por primera vez.

No obstante, me ha sorprendido la baja calidad de muchas las frases que se someten a revisión (hay muchos extractos sin sentido: “email”, por ejemplo, o frases inacabadas, hay una persona que está enviando la Biblia completa, a medio versículo arcaizante cada vez, muchísimas frases compuestas casi exclusivamente de nombres propios, a menudo extranjeros, como “Actuó con XX YY, con AA BB y con ZZ WW”, etc.). Además, entre las frases grabadas para revisar, parece que la gente graba cualquier cosa, sin importar si tiene sentido o conocen las palabras y sin volver a grabar lo que les sale mal.

Mi pregunta es: ¿qué tipo de moderación se está haciendo? Es decir, ¿sirve de algo ir revisando las frases? Hay usuarios que están contribuyendo y que claramente no están cumpliendo los requisitos cuando envían trozos de frases, textos antiguos, poco naturales o imposibles de entender sin contexto. ¿Se les limita en algún momento la posibilidad de continuar enviando contenido? ¿O a los que hacen grabaciones con muy poca calidad? Más que nada porque supone una pérdida de tiempo para el resto de colaboradores.

Por otro lado, también quería saber qué hacer en caso de encontrar errores de puntuación o de ortografía. Muchas frases empiezan con minúscula o acaban con dos puntos, o no tienen comas cuando deberían. ¿Es mejor marcarlas con “Informar - Error de gramática u ortografía” o es mejor darles “No” directamente? ¿Se van a revisar si se marca el error ortográfico o gramatical? Porque son más clics que simplemente darle a “No” si el resultado es el mismo.

¿Y en el caso de frases inacabadas o sin sentido completo? ¿Y cuando casi todo son nombres propios?

Me interesa el proyecto, pero me ha desmotivado un poco ver el estado de muchas de las contribuciones, desafortunadamente

En cualquier caso, ¡gracias por sacarlo adelante! Hay mucho material útil.

Buenos dias creo que llevas poco tiempo entre nosotros y todo lo que dices tiene sentido deberias leer los apartados sobre pautas de valoracion.Las frases muchas de ellas fueron sacadas mediante un algoritmo directamente de la red creo que fue de wikipedia pero no estoy seguro. Por lo cual a veces tienen errores
simplemente di que no o tienes la opcion de otro idioma o mal ortograficamente.
ten encuenta que no se trata de que esten bien que tambien sino que se diga sobre todo lo que pone en la frase ya que son modelos de aprendizaje para reconocimento de voz o pasar la voz a texto. Es mas importante que este bien dicha la frase que no se coman palabras ose inventen otras que no estan que la propia ortografia por supuesto tienes la opcion de decir que esta mal ortograficamente

Para tratar de explicar lo que se puede validar o no voy a tratar de explicar desde lo que yo se si hay algun error y alguien sabe mas que lo explique ya que yo no soy informatico ni programador.
uno de los primeros procesos que se suelen hacer con la base de datos es la normalizacion que basicamente es poner todos los audios al mismo volumen porque se hace esto entiendo para que el sonido sea constante
otro proceso es pasarlo a 16 bits para evitar tonos y añadidos que puedan dar a error
por ultimo se desarrolla un programa informatico que compara cada archivo de sonido con su representacion grafica supongo que palabra a palabra esto es muy basico ya lo se pero para que el resto de los mortales que no somos informaticos podamos entender lo que se hace de hay la importancia de sonido y su correspondiente grafismo un saludo