Come comunità abbiamo ricevuto molte domande riguardo a dei criteri per l’approvazione delle registrazioni. Abbiamo deciso, pertanto, di scrivere “nero su bianco” delle linee guida in modo tale da essere chiare e pubbliche.
La regola principale è “La registrazione è chiara e comprensibile anche senza leggere la frase?”
“No”: rifiuto a priori
“Sì”: posso procedere con le ulteriori verifiche
Ulteriori verifiche:
La registrazione coincide esattamente con la frase? Ovvero, le parole sono pronunciate tutte e in maniera corretta (e nello stesso ordine!)?
La registrazione non presenta rumore di sottofondo o, se presente, è lieve e l’audio è distinguibile?
Se le domande “Ulteriori verifiche” precedenti sono tutte “Sì”, allora la registrazione è da approvare, altrimenti è da rifiutare
Eventuali clic alla fine della registrazione danno fastidio? Se sono alla fine della registrazione, quando la frase è già stata completata, vanno bene. Non è un problema.
Registrazioni con accenti e cadenze molto marcate sono un problema? No, a patto che siano soddisfatte le regolette riportate sopra.
Registrazioni con molte parole straniere sono da rifiutare? No. Se le parole, anche straniere, sono pronunciate “correttamente”, (ovviamente non è necessario che vengano pronunciate come un nativo di quella lingua, ma va bene anche “all’italiana”), la frase è da approvare. È un peccato segnalare e rifiutare una registrazione corretta solo perché presenta delle parole straniere al suo interno.
Alcune frasi presentano la lettura della punteggiatura, come comportarsi? Non bisogna leggere la punteggiatura, essa serve solo per far capire il senso della frase e dare la giusta intonazione.
Pertanto, le registrazioni che presentano questo difetto sono da rifiutare .
Mi è stato segnalato che alcune registrazioni contengono la punteggiare letta (quindi , come virgola, ecc.). Ovviamente non bisogna leggere la punteggiatura, essa serve solo per far capire il senso della frase e dare la giusta intonazione.
Pertanto, le registrazioni che presentano questo difetto sono da rifiutare.
più che altro il problema è scegliere un approccio metodologico e seguirlo. Se deve riconoscere l’italiano come idiome, allora la parola inglese pronunciata in cockney è palesemente errata, se la parola è deep la dovrai leggere all’ italiana de-ep e non diip. Bourne Identity bourne identitii invece di bour aidentiti|
Ni. Nell’italiano comune e parlato utilizzi termini inglesi spesso e volentieri e non necessariamente pronunciati in maniera errata.
La pronuncia cockney è complessa per gli stessi britannici, quindi credo che gli italiani, in genere, pronuncino i termini in “americano” o, al massimo, in “britannico (RP)”.
Non credo di aver mai sentito pronunciare “deep” come /de-ep/, ma sempre come /di:p/, anche in italiano; in ogni caso, il problema è che, in realtà, anche nell’inglese (così come in tutte le lingue) ci sono moltissimi accenti e ovviamente non è richiesta la pronuncia “priva di accento”, proprio perché uno degli obiettivi di Common Voice è riuscire a capire qualsiasi cadenza/accento/pronuncia.
Ciao, ho notato che nei testi ci sono molte abbreviazioni, sigle, singole lettere.
La logica che sto seguendo è di non convalidare la registrazione nel caso la pronuncia non segua esattamente il testo.
Detto così sembra ok…ma le sigle molte volte vengono pronunciate con il loro nome completo…Come bisognerebbe comportarsi? mi spiego meglio.
Tutti gli esempi che seguono li ho incontrati nella convalida.
Esempio 1:
Testo: ‘La lunetta centrale presenta una Madonna con Bambino in trono e i Ss.’
Voce: ‘La lunetta centrale presenta una Madonna con Bambino in trono e i Santi’
Non ho convalidato (PS: mi è dispiaciuto perchè era un bravissimo speaker. )
Esempio 2:
Non ho preso nota del testo esatto, ma finiva con ‘post-sw’
Voce: ‘post-s doppia-w’
Non ho convalidato
Esempio 3
Testo: ‘La materia è oggi oggetto delle previsioni degli artt.’
Voce: ‘La materia è oggi oggetto delle previsioni degli artt.’
Convalidato
PS: se avesse detto ‘articolo’ non avrei convalidato.
Esempio 4
‘spa’,
pronunciato ‘esse-pi-a’
Convalidato.
Esempio 5
‘mr.’
pronunciato ‘mister’
Non ho convalidato perchè la frase finiva con ‘Mr.’ senza un nome di persona.
Singole lettere:
‘s’ , validato solo se pronunciato ‘ss’ o ‘esse’ (ho fatto bene?)
‘n.’ pronunciato ‘numero’ NON ho convalidato perchè la frase finiva con ‘n.’ senza un numero.
…si potrebbero fare molti esempi di abbreviazioni e sigle e di come (non) dovrebbero/potrebbero essere pronunciate ma ho scritto solo dei casi che ho incontrato.
PS: complimenti agli speaker, ci sono alcuni ed alcune che mi hanno veramente colpito…ma TUTT* eccezzionali!
Dunque purtroppo le sigle sono un problema.
La logica che adottiamo, di solito, è di leggerle così come sono o come potrebbero essere pronunciate. Ad esempio
“spa” può essere pronunciata sia come “Spa” sia come “Esse-Pi-A”. Entrambe sono corrette.
Per “Mr.” (esempio 5) hai fatto bene a rifiutare la registrazione, ma non perché finiva per “Mr.” senza altro, quanto perché è un abbreviazione e, in aggiunta, un termine inglese.
Per “s” corretto (“esse” o “ss”), per “n.” idem (“enne” o “nn”).
Mi hai dato un ottimo feedback comunque, infatti vado subito ad aggiungere nelle regole di registrazione di segnalare come “Abbreviazione” e di non registrarle. Grazie!
Credo di capire il punto di @diegosantini . Il fatto è che io, come penso la maggior parte degli italiani che hanno studiato inglese, pronuncio l’inglese in due modi diversi a seconda della situazione: se sto parlando in inglese con una persona straniera, so più o meno emulare il PR; se sto parlando in italiano con una persona italiana, e nella frase devo dire una parola inglese, la dico all’italiana (es. se devo dire “marker”, le R le pronuncio all’italiana, proprio belle marcate e vibranti come la R di “rana”). Credo che quasi tutti lo facciamo. A parte i fenomeni e quelli che hanno vissuto all’estero. Ma su Common Voice? Un’indicazione non sarebbe male, secondo me.