Привіт. Почав щось надиктовувати, але стикнувся з тим, що більшість тексту - це якась навколополітична маячня або архаїзми з одного роману. Сумно, що хтось паскудить український розвиток.
Не впевнений, куди писати, тому скопіюю ще тут.
Оригінал повідомлення тут
Sorry, I can’t access to ‘kinto’ url, so can’t provide in requested format.
Ukrainian sentences contain a lot of text from a single book. And they have very bad quality.
Source: cetation of Володимир Білінський
The book is
“Білінський Володимир Броніславович. КРАЇНА МОКСЕЛЬ, або МОСКОВІЯ”
Very “holy-war” and politized one.
Sentence:
“Ростовсько-суздальська земля до приходу Рюриковичів зі своїми ватагами давно була заселена фінськими племенами”
Link
Sentence:
“Початковий київський літопис доволі точно позначає місця проживання цих племен: він знає”
Link
Sentence:
“Здавалося б, за церковними канонами, «царство Боже й царство кесареве мусять залишатися навіки розділеними»”
Link
Sentence:
“Карамзін був палким великоросом на службі в імперії й Государя”
Link
Link to google book (not sure if it’s legal copy)
Google Book
And yet another one. It contains a lot of old/rare words. The meaning of some of them I even don’t know.
Book “Меч Арея” by Іван Білик. Link to online copy here
Sentence:
“І не питаєш, чого ради смо прийшли?”
Link
Sentence:
“Пощо тобі князь? — жваво всміхнувся отрок у сорочці.”
Link
Link to source
Sentence:
“Богдан пропустив його слова повз вуха, й усі троє посідали на коней.”
Link
These two books kill all pleasure from the project. Unfotunately, 80% of sentences now come from them.
Could you resolve it somehow, please?
Привіт.
Можна додавати свої речення та верифікувати речення які додали інші. Це робиться в сентенс колекторі
Наразі туди хтось залив великий пак слів зі словника, тому там 311к для перевірки. Треба їх якось підчистити.
Повністю підтримую, тексти дуже засмічені релігійними язичниками з криптосвастиками з пальців у кишенях. Або тролями з Ольгіно.
Словник ніби видалили, тепер там просто інша книжка на усі 200 сторінок Review. Одна книжка.
Неважливо яке там джерело, доки нормальні речення і немає порушення прав.
Треба знайти 3х користувачів, які оцінять це все
Чи відсіваєте ви речення штибу: "якийсь текст бла-бла «братушкі» . Маю на увазі не закриті лапки та іншомовні слова в лапках. Останнє явно суперечить настановам, а перше, так мені видається, псуватиме якість навчання програми-обробника? Я особисто відхиляю такі речення.