LINUX.ORG.RU

Морфологический разбор


0

0

Всем доброго времени суток.

Возникла проблема организации поиска, причем чтобы находилось не только само слово, но и любое однокоренное. Не присоветуете ли что-нибудь в виде пакета или скрипта для морфологического разбора.

Заранее благодарен.

★☆☆

Re: Морфологический разбор

> чтобы находилось не только само слово, но и любое однокоренное

в свете того что русское слово уронить и английское слово run однокоренные, это задача убиться оп стену.

dilmah ★★★★★ ()

Re: Морфологический разбор

>любое однокоренное

зырить - зрение. однокоренные=>

не вижу другого способа, кроме сопоставления данного слова с набором уже собранных кем-то вместе синонимов (есть словари синонимов - поищи в библиотеках)

2 dilmah нет безвыходных ситуаций

record ★★★★★ ()
Ответ на: Re: Морфологический разбор от dilmah

Re: Морфологический разбор

> в свете того что русское слово уронить и английское слово run > однокоренные, это задача убиться оп стену.

Они однокоренные, если только "уронить" напишет падонак в транслите. Дураков много, и от всех нет зашиты. Таким же макаром можно искать в русском тексте слово, написанное хираганой.

То что однокоренные в ОДНОМ языке - это по умолчанию. Пожалуй и вправду стоит оговориться, что речь идет о русском языке.

r_asian ★☆☆ ()
Ответ на: Re: Морфологический разбор от r_asian

Re: Морфологический разбор

> Они однокоренные, если только "уронить" напишет падонак в транслите

ну они действительно однокоренные. Когда ты что-то роняешь, оно у тебя утекает:), сбегает:) В западнославянских языках есть слово ронить -- течь. Отсюда название реки Рона. А слово run и ронить-течь уже очевидно близки.

что касается перемены а->o то ведь есть корень лаг/лож -- это один корень.

dilmah ★★★★★ ()
Ответ на: Re: Морфологический разбор от dilmah

Re: Морфологический разбор

хорошо, что сузили область определения, а то б пришлось выискивать и такие однокоренные слова, как apple и яблоко, pool и болото, а русские "окно" и "око"?:-))

record ★★★★★ ()

Re: Морфологический разбор

В postgres для полнотекстового поиска используется модуль snowball, там не всё идеально, но работает, правда, беэ ковыряния только с однобайтовыми кодировками.

macr ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.