PROYECTO DE DIRECTRICES PARA REVISAR GRABACIONES
Problemas con la grabación.
Malentendidos
Se debe verificar con mucho cuidado que lo que se ha grabado es exactamente lo que se ha escrito; rechaza si hay incluso errores menores. Los errores más comunes son:
- Pérdida de ‘Un, Uno, La, Los’ al comienzo de la grabación.
- Falta una ‘S’ al final de una palabra.
- Perder el final de la última palabra cortando la grabación demasiado rápido.
- Tomando varios intentos de leer una palabra.
Por ejemplo:
- Los carros viajan por la carretera.
-
Carros viajan por la carretera.
[‘Los’ omitido] -
Los carro viajan por la carretera.
[Deberían ser ‘carros’] -
Los carros viajan por la carretera.Cuando
[Grabación es cortada antes del final de la última palabra] - Los carros viajan por la carretera-nueva.
- [Se ha registrado más que el texto requerido]
- [El primer ‘nueva-’ no está en el texto escrito]
Pronunciaciones variadas
Ten cuidado antes de rechazar un clip sobre la base donde el lector ha pronunciado mal una palabra, ha puesto el enfoque en el lugar equivocado o aparentemente ha ignorado un signo de interrogación. Hay una gran variedad de pronunciaciones en uso en todo el mundo, algunas de las cuales tal vez no haya escuchado en su comunidad local. Proporciona un margen de apreciación para aquellos que pueden hablar de manera diferente a ti.
Por otro lado, si cree que el lector probablemente nunca se ha cruzado con la palabra antes, y simplemente está haciendo una suposición incorrecta sobre la pronunciación, rechaza. Si no estas seguro, usa el botón de omisión.
Ruido de fondo
Queremos que los algoritmos de aprendizaje automático puedan manejar una variedad de ruido de fondo, e incluso se pueden aceptar ruidos relativamente altos siempre que no impidan que escuche la totalidad del texto. La música de fondo tranquila está bien; música lo suficientemente alta como para evitar que escuches todas y cada una de las palabras no.
- {Estornudar} Los dinosaurios gigantes del Triásico {tos}.
-
El gigante dino {tos} el Triásico.
[Parte del texto no se puede escuchar]
Si la grabación se interrumpe o tiene crujidos, rechace a menos que se pueda escuchar la totalidad del texto:
-
{Crackle} dinosaurios gigantes de {crackle} -riassic.
[Parte del texto no se puede escuchar]
Voces de fondo
Un ruido de fondo silencioso está bien, pero no queremos voces adicionales que puedan hacer que un algoritmo identifique palabras que no están en escritas en el texto. Si puedes escuchar palabras distintas aparte de las del texto, el clip debe ser rechazado. Por lo general, esto sucede donde se ha dejado encendida la TV, o donde hay una conversación cerca.
- Los dinosaurios gigantes del Triásico. [leído por una sola voz] ¿Vienes? [llamado por otro]
Volumen
Habrá variaciones naturales en el volumen entre los lectores. Rechaza solo si el volumen es tan alto que la grabación se interrumpe, o (más comúnmente) si es tan bajo que no puedes escuchar lo que se dice sin referencia al texto escrito.
Efectos de lectura
La mayoría de las grabaciones son de personas que hablan con su voz natural. Puedes aceptar la grabación ocasional no estándar que se grita, se susurra o, obviamente, se entrega con una voz “dramática”. Rechaza las grabaciones cantadas y las que usan una voz sintetizada por computadora.
Problemas con el texto escrito.
Consulta Discusión de nuevas pautas para la validación de oraciones cargadas
¿Todavía no estás seguro?
Si encuentras algo que estas pautas no cubren, vote de acuerdo a su mejor criterio. Si realmente no puede decidir, use el botón de omisión y continúe con la próxima grabación.
Puedes consultar la version original en el siguiente enlace: Discussion of new guidelines for recording validation