Питання щодо якості тексті та авторських прав

Привіт. Почав щось надиктовувати, але стикнувся з тим, що більшість тексту - це якась навколополітична маячня або архаїзми з одного роману. Сумно, що хтось паскудить український розвиток.
Не впевнений, куди писати, тому скопіюю ще тут.
Оригінал повідомлення тут

3 Likes

Sorry, I can’t access to ‘kinto’ url, so can’t provide in requested format.
Ukrainian sentences contain a lot of text from a single book. And they have very bad quality.

Source: cetation of Володимир Білінський
The book is
“Білінський Володимир Броніславович. КРАЇНА МОКСЕЛЬ, або МОСКОВІЯ”
Very “holy-war” and politized one.

Sentence:
“Ростовсько-суздальська земля до приходу Рюриковичів зі своїми ватагами давно була заселена фінськими племенами”
Link

Sentence:
“Початковий київський літопис доволі точно позначає місця проживання цих племен: він знає”
Link

Sentence:
“Здавалося б, за церковними канонами, «царство Боже й царство кесареве мусять залишатися навіки розділеними»”
Link

Sentence:
“Карамзін був палким великоросом на службі в імперії й Государя”
Link

Link to google book (not sure if it’s legal copy)
Google Book

And yet another one. It contains a lot of old/rare words. The meaning of some of them I even don’t know.

Book “Меч Арея” by Іван Білик. Link to online copy here

Sentence:
“І не питаєш, чого ради смо прийшли?”
Link

Sentence:
“Пощо тобі князь? — жваво всміхнувся отрок у сорочці.”
Link
Link to source

Sentence:
“Богдан пропустив його слова повз вуха, й усі троє посідали на коней.”
Link

These two books kill all pleasure from the project. Unfotunately, 80% of sentences now come from them.
Could you resolve it somehow, please?

1 Like

Привіт.

Можна додавати свої речення та верифікувати речення які додали інші. Це робиться в сентенс колекторі

Наразі туди хтось залив великий пак слів зі словника, тому там 311к для перевірки. Треба їх якось підчистити.

Повністю підтримую, тексти дуже засмічені релігійними язичниками з криптосвастиками з пальців у кишенях. Або тролями з Ольгіно.

Словник ніби видалили, тепер там просто інша книжка на усі 200 сторінок Review. Одна книжка.

Неважливо яке там джерело, доки нормальні речення і немає порушення прав.
Треба знайти 3х користувачів, які оцінять це все

Чи відсіваєте ви речення штибу: "якийсь текст бла-бла «братушкі» . Маю на увазі не закриті лапки та іншомовні слова в лапках. Останнє явно суперечить настановам, а перше, так мені видається, псуватиме якість навчання програми-обробника? Я особисто відхиляю такі речення.

1 Like