LINUX.ORG.RU

Поиск повторений в ElasticSearch

 , ,


0

1

Добрый вечер. Планирую установить ElasticSearch для поиска и хранения комментариев. Вопрос в следующем - как правильно хранить комментарии пользователей чтобы я смог затем смотреть самые повторяющиеся слова в них?

Не совсем понятно, ты комментарии хранишь или статистику по ним собираешь?

Кажется, навскидку вариантов кроме собственно text у тебя и нет.

Почитай про index options и term vector.

Ну и про analyzers.

Если язык комментариев будет сильно грамматически отличаться от английского - могут быть проблемы.

TheKnight ★★★
()

В каком смысле как? Как текст. Делаешь выборку всех записей по полю и считаешь в них слова.

Serbis
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.