Написал стеммер для русского языка на чистом Power Query M. Даете ему слово, и получаете основу этого слова (часть слова без окончаний, суффиксов и т.п.).
Точность для моих целей достаточная. Естественно, хуже, чем со словарём всех словоформ и хуже, чем MyStem, но зато работает на утюге в Power BI и Excel 😉
В метаданные результата записывается найденная "часть речи".
Метаданные | Что означает |
---|---|
PERFECTIVEGERUND | Слова вроде "улыбавшись", "простив". Не знаю, как называется эта часть речи |
ADJECTIVE | Прилагательное. Например, "забавная" |
ADJECTIVAL | Хмм. Например "отдыхающий" |
REFLEXIVE | Возвратный глагол? Оканчивается на "ся", "сь" |
VERB | Глагол |
NOUN | Cуществительное |
SUPERLATIVE | Превосходная степень: "важнейший" |
DERIVATIONAL | Cуществительное, образованое от другой части речи. Например, "безопасность" |