Всех приветствую. В русском корпусе записей появилась новая проблема. Мне начали попадаться записи, которые словно произнесены то ли синтезатором речи, то ли человеком, применяющим какие-то эффекты к своему настоящему голосу. Я не уверен, что именно из этого верно, из-за того, что:
— Иногда я слышу на записях нажатие на мышь.
— Разнообразие таких голосов достаточно большое, что очень странно в том случае, если это синтез речи.
— Иногда в таких записях голоса говорят даже чище, чем люди в записях, в человечности которых я уверен.
— В таких записях нередко произносится буква “ё” даже там, где она не написана.
Честно, я действительно озадачен, что мне делать со всеми этим записями. К сожалению, опубликовать ссылки на примеры не могу, так как такой возможности попросту нет на Common Voice.
Если человек, который это сделал, читает этот пост, пожалуйста, отзовись. Мне важно знать, что именно вы сделали, чтобы понять, можно ли принять записи. Если я не получу ответа в течение недели, то, к сожалению, мне однозначно придётся их отклонять. Ведь принимать нужно те записи, которые записаны именно людьми. По крайней мере пока что политика проекта такова. Поэтому если не получится быть уверенным в человечности этих записей, мне придется их отклонять. Пока же я их просто пропускаю