Pautes de reivisió dels talls de veu en català

(Basat en la proposta al web de Softcatalà)

Cal revisar els talls de veu que s’enregistren en el Common Voice i que estan pendents de revisió. Un tall de veu es considera vàlid si aconsegueix 2 vots positius. Així doncs, cal fer el doble de feina per a validar que per a enregistrar.

  • Sigueu flexibles. L’objectiu del Common Voice és fer un motor de reconeixement de veu de qualsevol parlant, també d’algú no nadiu, no pas un motor de síntesi de veu amb una dicció perfecta.
  • Si la transcripció del tall es correspon amb el text mostrat, valideu la frase. Altrament, rebutgeu-la.
  • La frase que escolteu s’ha de correspondre amb el text escrit paraula per paraula.
  • De vegades el reproductor d’àudio falla. Si el text es talla, o no sentiu res, abans de rebutjar la frase, torneu a escoltar-la. Si segueix tallant-se, podeu rebutjar-la.
  • No importa si l’àudio és molt baix o molt alt. Sempre que s’entengui la locució.
  • No importa que el dialecte del locutor no correspongui amb les formes verbals o el lèxic (p. ex. “patesques” pronunciat amb vocal neutra). El que importa és que la frase es correspongui amb el text escrit, estigui ben llegida i usant el mateix dialecte durant tota la frase.
  • No importa que hi hagi sorolls de fons. El motor ha d’aprendre a treballar amb soroll de fons. Si el text s’entén i coincideix amb la frase, doneu-lo per bo.
1 Like

Hola Joan,

com s’hauria de valorar un tall on es pronuncia “ses” per “les” en ser una persona que parla salada?

Moltes gràcies
Jaume

Hola, Jaume

La resposta depèn del que vulguis que faci un motor de reconeixement de veu:

  1. Si vols que l’article salat es transcrigui amb l’article literari, aleshores has de donar el tall per bo.
  2. Si vols que l’article salat es transcrigui salat, aleshores has de donar el tall per dolent.

Jo, particularment, m’inclino per la segona opció (transcriure l’article salat de forma fidel). Això després permet, si es vol, processar la transcripció per a passar l’article salat a literari. En canvi, si directament s’entrena el motor per a transcriure l’article salat com a literari, es perd informació.

1 Like

Hola,

No sé si és el fil correcte, però volia comentar-ho. Entenc que l’objectiu és llegir el text per donar la veu. De totes maneres, que hem de fer quan trobem alguna paraula que no ens encaixa en català? Parlo de quan donem la veu, no de quan validem.

M’he trobat expressions que crec que no són correctes (recordo un “fer-se amb una cosa” referint-se a agafar-ho, que és una traducció del “hazte con todos”), com directament paraules escrites en castellà (moltíssims cops m’he trobat “Irán”, del verb “Ir”). Pot ser que m’equivoqui i que formi part d’algun dialecte (ho desconec), però el que estic fent és rebutjar la frase amb el botó “Informa” i explicant-ho.

Ho estic fent bé? No sé fins a quin punt hem de ser puristes amb el text (sobretot en quant a les expressions).

Moltes gràcies!

Ep! Ni idea de si ho llegiràs @AniolValera, però el verb anar, en futur i condicional, es conjuga així en el dialecte septentrional (iré, iràs, iria, iries,…). Compte amb això que si no a l’Empordà s’emprenyaran :joy:
https://geiec.iec.cat/conjugacio/verb/1236?verb=anar&codi=1236

1 Like