LINUX.ORG.RU

У тебя задача какая? Если привести слово к нормальной форме, то для этого уже есть pymorphy2. Но если прямо корни нужны для чего-то, то тогда не знаю.

gnunixon ★★★
()

На kaggle ещё лежит датасет лемматизированных русских слов, можно в качестве теста использовать.

А так - оратор выше прав, pymorphy2 работает отлично. Есть ещё стеммер от Яндекса, но что-то я им не проникся от слова «вообще».

Solace ★★
()
Последнее исправление: Solace (всего исправлений: 1)
Ответ на: комментарий от Solace

К сожалению, нужны именно корни, лемматизация не подойдет.

maked0n
() автор топика
Последнее исправление: maked0n (всего исправлений: 1)

Ну первый корень ты уже добавил, это тег «ml»

psv1967 ★★★★★
()

А базу от AOT распотрошить не получится? Там вроде фалик с морфологией р.я. есть.

pacify ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.