(Basat en la proposta al web de Softcatalà)
Cal revisar els talls de veu que s’enregistren en el Common Voice i que estan pendents de revisió. Un tall de veu es considera vàlid si aconsegueix 2 vots positius. Així doncs, cal fer el doble de feina per a validar que per a enregistrar.
- Sigueu flexibles. L’objectiu del Common Voice és fer un motor de reconeixement de veu de qualsevol parlant, també d’algú no nadiu, no pas un motor de síntesi de veu amb una dicció perfecta.
- Si la transcripció del tall es correspon amb el text mostrat, valideu la frase. Altrament, rebutgeu-la.
- La frase que escolteu s’ha de correspondre amb el text escrit paraula per paraula.
- De vegades el reproductor d’àudio falla. Si el text es talla, o no sentiu res, abans de rebutjar la frase, torneu a escoltar-la. Si segueix tallant-se, podeu rebutjar-la.
- No importa si l’àudio és molt baix o molt alt. Sempre que s’entengui la locució.
- No importa que el dialecte del locutor no correspongui amb les formes verbals o el lèxic (p. ex. “patesques” pronunciat amb vocal neutra). El que importa és que la frase es correspongui amb el text escrit, estigui ben llegida i usant el mateix dialecte durant tota la frase.
- No importa que hi hagi sorolls de fons. El motor ha d’aprendre a treballar amb soroll de fons. Si el text s’entén i coincideix amb la frase, doneu-lo per bo.