[RU] Робоголоса или голоса с эффектами в русском корпусе

Всех приветствую. В русском корпусе записей появилась новая проблема. Мне начали попадаться записи, которые словно произнесены то ли синтезатором речи, то ли человеком, применяющим какие-то эффекты к своему настоящему голосу. Я не уверен, что именно из этого верно, из-за того, что:
— Иногда я слышу на записях нажатие на мышь.
— Разнообразие таких голосов достаточно большое, что очень странно в том случае, если это синтез речи.
— Иногда в таких записях голоса говорят даже чище, чем люди в записях, в человечности которых я уверен.
— В таких записях нередко произносится буква “ё” даже там, где она не написана.

Честно, я действительно озадачен, что мне делать со всеми этим записями. К сожалению, опубликовать ссылки на примеры не могу, так как такой возможности попросту нет на Common Voice.

Если человек, который это сделал, читает этот пост, пожалуйста, отзовись. Мне важно знать, что именно вы сделали, чтобы понять, можно ли принять записи. Если я не получу ответа в течение недели, то, к сожалению, мне однозначно придётся их отклонять. Ведь принимать нужно те записи, которые записаны именно людьми. По крайней мере пока что политика проекта такова. Поэтому если не получится быть уверенным в человечности этих записей, мне придется их отклонять. Пока же я их просто пропускаю

1 Like

Прошло две недели, и я потихоньку начинаю их отклонять. Здесь всё ещё можно отписаться, чтобы меня остановить

По некоторым голосам явно узнается говорилка сделанная на основе дубляжа из варкрафт 3,появившаяся несколько месяцев назад. Всякие шумы и птицы тоже скорее всего оттуда же, потому что это не простой синтез речи, а сгенерирован нейронкой, то есть воспроизводит птиц, звуки лошадей и прочие фоновые звуки. Их можно смело отклонять

А вот что делать с искаженными голосами я тоже не очень понимаю. Иногда запись звучит как-то будто замедленно или с пачкой эффектов поверх записи

1 Like

Точно, спасибо! Как-то я о ней совсем забыл

1 Like

А, я думал, что это фишка такая. Типа больше вариантов голосов, в том числе и синтезированных. Ну чтобы Алиса и Сири друг друга лучше понимали.

Так что дропать потому что “не человек”? По правильности вроде было ок (проверил совсем немного).