Elasticsearch 1.4

5

2

Выпущена новая версия Elasticsearch — современного распределенного движка полнотекстового поиска и выполнения аналитических запросов реального времени.

Одной из основных целей при выпуске этой версии — повышение стабильности и надежности сервиса:

Значительно улучшен алгоритм управления кластером и выбора master-узла, ранее имевший ряд известных проблем
Добавлена проверка контрольных сумм хранимых данных для определения «битых» сегментов индекса и журналов операций
Механизм прерывания исполнения запроса при превышении лимита на потребление оперативной памяти

Также в этой версии:

Оптимизирован механизм doc values — поколоночного хранилища данных для быстрого извлечения значений по первичному ключу. Механизм заменяет field cache — структуру в памяти, выполняющую аналогичную функцию. Использование doc values позволяет уменьшить потребление памяти процессом Elasticsearch и лучше использовать функции кеширования диска операционной системой. До оптимизации хранилище заметно уступало по производительности field cache.
Query cache — кеш результатов аналитических запросов, сохраняющий результаты выборок при отсутствии изменений. Кеш рекомендуется использовать в задачах анализа журналов в сочетании с партиционированием индексов по дате события. В этом случае финальный результат запроса будет получен комбинацией кешированных результатов из исторических партиций и выполненного запроса по свежей секции в которую идет запись.
Flake ID — новый алгоритм генерации идентификаторов документов, который снижает количество случайного ввода-вывода (оптимизация добавления в индекс документов без заданного пользователем идентификатора).
Эффективная поддержка HTTP Pipelining в пользовательском API

>>> Подробности

Ссылка

← Brackets 1.0

7 ноября — Ночь свободных игр в Москве →

Механизм прерывания исполнения запроса при превышении лимита на потребление оперативной памяти

Бог есть!

tazhate ★★★★★
(05.11.14 21:56:19 MSK)

Ссылка

А они до сих пор не прикрутили нативную поддержку русского языка ?

~~Jopich~~
(05.11.14 22:07:45 MSK)

Ответ на: комментарий от Jopich 05.11.14 22:07:45 MSK

А они до сих пор не прикрутили нативную поддержку русского языка ?

Snowball с поддержкой русских словоформ там много лет как есть.

maxcom ★★★★★
(05.11.14 22:11:15 MSK) автор топика

красота, надо найти времени потестить

val-amart ★★★★★
(05.11.14 22:30:53 MSK)

Ссылка

superb!

q11q11 ★★★★★
(05.11.14 22:51:19 MSK)

Ссылка

Поиск на ЛОРе нормально заработает?

CYB3R ★★★★★
(05.11.14 23:34:42 MSK)

ЛОР упадёт? :}

Deleted
(06.11.14 00:18:38 MSK)

Ссылка

Круть. Терм-агрегаторы стали работать бытрее фасетов?

drull ★☆☆☆
(06.11.14 01:14:17 MSK)
Последнее исправление: drull 06.11.14 01:17:05 MSK (всего исправлений: 1)

Ответ на: комментарий от Jopich 05.11.14 22:07:45 MSK

Зачем нативная если плагин есть?

https://github.com/imotov/elasticsearch-analysis-morphology

drull ★☆☆☆
(06.11.14 01:29:33 MSK)

Ссылка

Чем лучше Сфинкса?

Wizard_ ★★★★★
(06.11.14 02:05:52 MSK)

Ответ на: комментарий от Wizard_ 06.11.14 02:05:52 MSK

Тем что на джаве

Terminal_Velocity
(06.11.14 08:07:22 MSK)

Ответ на: комментарий от Terminal_Velocity 06.11.14 08:07:22 MSK

Он спрашивал про «лучше».

anonymous
(06.11.14 09:12:31 MSK)

Ссылка

Ответ на: комментарий от Wizard_ 06.11.14 02:05:52 MSK

менее кривой

~~Jopich~~
(06.11.14 09:14:39 MSK)

это из-за него поиск на ЛОР-е не позволяет найти точное совпадение для фразы из более, чем одного слова?

Lincor ☆
(06.11.14 09:41:20 MSK)

Ответ на: комментарий от Jopich 06.11.14 09:14:39 MSK

менее кривой

На кривость Сфинкса совсем не жалуюсь. Отрабатывает всегда корректно. Посмотрел про ES, его основное отличие — оно хранит не только индекс, но и сами данные, так что его можно как хранилище использовать. Но мне такой надобности нет.

Wizard_ ★★★★★
(06.11.14 12:54:32 MSK)

Ответ на: комментарий от Wizard_ 06.11.14 12:54:32 MSK

в sphinx API, которое используется без БД Mysql является уже deprecated ( в этом легко убедится посмортев в исходники этого API ). Создатели sphinx призывают использовать связки sphinx+mysql вместо просто бинарного индекса . Что касается поддержки - она в sphinx кривая пока не заплатишь деньги за эту поддержку.

~~Jopich~~
(06.11.14 13:32:51 MSK)

Ссылка

Ответ на: комментарий от Wizard_ 06.11.14 02:05:52 MSK

Компактнее индексы, быстрее работает, может в морфологию.

anonymous
(06.11.14 15:30:55 MSK)

Ссылка

Лучше Apache Solr

anonymous
(06.11.14 17:00:47 MSK)

Ссылка

Ответ на: комментарий от maxcom 05.11.14 22:11:15 MSK

Snowball с поддержкой русских словоформ там много лет как есть.

Это ж обычный тупой стемер, с ним русская морфология очень убогая получается. Для русского надо AOT, типа того что в SphinxSearch.

Vit ★★★★★
(06.11.14 17:46:54 MSK)

А подскажите примерные цены на фрилансеров, умеющих сабж?

~~xtraeft~~ ★★☆☆
(06.11.14 17:51:13 MSK)

Поттеринг в курсе? Уже пилит замену?

anonymous
(06.11.14 18:48:29 MSK)

Ссылка

Ответ на: комментарий от xtraeft 06.11.14 17:51:13 MSK

А подскажите примерные цены на фрилансеров, умеющих сабж?

Под какие задачи?

home_user ★★★
(06.11.14 19:06:16 MSK)

Ответ на: комментарий от home_user 06.11.14 19:06:16 MSK

Разработать структуру индексов, да и просто проконсультировать по построению веб морд и как грамотно делать запросы.

~~xtraeft~~ ★★☆☆
(06.11.14 19:18:38 MSK)

Ссылка

Ответ на: комментарий от CYB3R 05.11.14 23:34:42 MSK

он и сейчас нормально работает. Есть какие-то конкретные примеры неправильной работы?

maxcom ★★★★★
(06.11.14 19:19:11 MSK) автор топика

Ответ на: комментарий от drull 06.11.14 01:14:17 MSK

Круть. Терм-агрегаторы стали работать бытрее фасетов?

Имхо они одинаково работают, разве нет?

maxcom ★★★★★
(06.11.14 19:19:53 MSK) автор топика

Ответ на: комментарий от Vit 06.11.14 17:46:54 MSK

Для русского надо AOT, типа того что в SphinxSearch.

В sphinx раньше был допиленный snowball, давно туда AOT прикрутили?

Да, ссылку на плагин который работает на основе AOT выше приводили, можешь привести реальные примеры на которых AOT лучше?

maxcom ★★★★★
(06.11.14 19:24:02 MSK) автор топика

Ответ на: комментарий от Lincor 06.11.14 09:41:20 MSK

это из-за него поиск на ЛОР-е не позволяет найти точное совпадение для фразы из более, чем одного слова?

сейчас фразы ищутся, покажи пример что именно не работает

maxcom ★★★★★
(06.11.14 19:24:51 MSK) автор топика

Ссылка

Ответ на: комментарий от maxcom 06.11.14 19:19:11 MSK

Сортировка по релевантности странная. И хочется ещё кавычки использовать.

CYB3R ★★★★★
(06.11.14 23:22:42 MSK)

Ответ на: комментарий от CYB3R 06.11.14 23:22:42 MSK

Покажи пример странности в сортировке.

Зачем тебе кавычки, какой use case?

maxcom ★★★★★
(06.11.14 23:30:38 MSK) автор топика

Ответ на: комментарий от maxcom 06.11.14 23:30:38 MSK

Недавно хотел найти конкретное сообщение, вбивал почти точную цитату из него. Стояла сортировка по релевантности, на первых двух страницах сообщения не было. С кавычками бы нашёл, наверное.
Потом нашёл. Сейчас покопаю историю браузера, может найду, что же я там искал.

CYB3R ★★★★★
(06.11.14 23:36:01 MSK)

Ссылка

Ответ на: комментарий от maxcom 06.11.14 19:24:02 MSK

В sphinx раньше был допиленный snowball, давно туда AOT прикрутили?

Года два-три назад.

можешь привести реальные примеры на которых AOT лучше?

Сейчас не могу. Надо заново все записи поднимать и вспоминать. Но точно помню, что в русском стемминг выдает нереально большое число кривых срабатываний. С английским нормально.

Vit ★★★★★
(06.11.14 23:48:51 MSK)

Ответ на: комментарий от Vit 06.11.14 23:48:51 MSK

стемминг выдает нереально большое число кривых срабатываний

snowball агрессивен, можно попробовать light-стеммеры.

shahid ★★★★★
(07.11.14 10:10:24 MSK)

Ссылка

Ответ на: комментарий от Wizard_ 06.11.14 12:54:32 MSK

его основное отличие — оно хранит...

его основное отличие - оно хорошо вширь тянется

оно хранит не только индекс, но и сами данные

может хранить, а может и не хранить

shty ★★★★★
(07.11.14 12:21:25 MSK)

Ссылка

Ответ на: комментарий от Vit 06.11.14 17:46:54 MSK

Это ж обычный тупой стемер, с ним русская морфология очень убогая получается

ээээ, стеммер возвращает нормальную форму слова в ответ на словоформу, на морфологию влияет чуть более чем никак

shty ★★★★★
(07.11.14 12:22:35 MSK)

Ссылка

Ответ на: комментарий от maxcom 06.11.14 19:19:53 MSK

Имхо они одинаково работают, разве нет?

Нет. Если в терм-аггрегаторе использовать регексп ( http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/search-... ), то это будет примерно в полтора раза медленнее чем аналогичный фасет. Проверяли когда делали автодополнение поискового запроса.

drull ★☆☆☆
(08.11.14 10:37:24 MSK)
Последнее исправление: drull 08.11.14 10:41:07 MSK (всего исправлений: 2)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Brackets 1.0

Open Source

7 ноября — Ночь свободных игр в Москве →

Похожие темы