LINUX.ORG.RU

У тебя задача какая? Если привести слово к нормальной форме, то для этого уже есть pymorphy2. Но если прямо корни нужны для чего-то, то тогда не знаю.

gnunixon ★★★ ()

На kaggle ещё лежит датасет лемматизированных русских слов, можно в качестве теста использовать.

А так - оратор выше прав, pymorphy2 работает отлично. Есть ещё стеммер от Яндекса, но что-то я им не проникся от слова «вообще».

Solace ★★ ()
Последнее исправление: Solace (всего исправлений: 1)

Ну первый корень ты уже добавил, это тег «ml»

psv1967 ★★★★★ ()

А базу от AOT распотрошить не получится? Там вроде фалик с морфологией р.я. есть.

pacify ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.