We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Здравствуйте. Токенизатор правильно разбивает тексты, где содержатся названия городов: Ростов-на-Дону Санкт-Петербург
Ростов-на-Дону Санкт-Петербург
Однако с диапазонами значений он поступает аналогично: 2016-2017 - один токен 5-кратное - один токен 10ти-кратное - разбивается на 10 и ти-кратное
2016-2017
5-кратное
10ти-кратное
10
ти-кратное
The text was updated successfully, but these errors were encountered:
2016-2017 - один токен
Спасибо, надо будет поправить
5-кратное - один токен
Это не ошибка, так? "5-кратное" должен оставаться одним токеном?
Sorry, something went wrong.
Насчет 5-кратное согласен с вами, так должно остаться. Слово пятикратное пишется слитно.
пятикратное
По правилам "10ти-кратное" - тоже неверное написание. Должно быть "10-кратное".
Цитатат из http://new.gramota.ru/spravka/letters/87-rubric-99 :
При использовании словесно-цифровой формы записи буквенные наращения после числительных не пишутся.
No branches or pull requests
Здравствуйте.
Токенизатор правильно разбивает тексты, где содержатся названия городов:
Ростов-на-Дону Санкт-Петербург
Однако с диапазонами значений он поступает аналогично:
2016-2017
- один токен5-кратное
- один токен10ти-кратное
- разбивается на10
ити-кратное
The text was updated successfully, but these errors were encountered: