Elasticsearch 1.0

3

4

Выпущена версия 1.0 Elasticsearch — сервера полнотекстового поиска и выполнения аналитических запросов в реальном времени. Elasticsearch представляет возможности распределения нагрузки по группе узлов с функциями отказоустойчивости; простой REST API с клиентами для большого количества языков; поддержку произвольного количества индексов и операций над группами индексов; работу в режиме без четко определенной схемы хранения данных. Elasticsearch построен на базе библиотеки Apache Lucene и распространяется под лицензией Apache 2.

Версия 1.0 находилась в разработке около 9 месяцев и включила более 8000 коммитов, созданных при участии более 180-ти контрибьюторов.

В этой версии (по сравнению с прошлой стабильной версией 0.90) были добавлены следующие функции:

Snapshot/Restore — набор API для создания backup'ов и восстановления индексов. Помимо локальной файловой системы, для хранения backup'ов может использоваться HDFS или Amazon S3.
Aggregations — новое семейство аналитических запросов. Функции построены на базе «фасетов» и дополнительно включают возможности вложенных агрегатов и комбинации агрегатных функций.
Distributed Percolation — новая реализация «percolator», «обратной» версии поиска. В этом режиме в индексе сохраняются поисковые запросы, а через API поступают новые документы, которые фильтруются через эти сохраненные запросы. Новая реализация позволяет распределять поисковую работу над одним документом по многим узлам, поддерживает функции подсветки совпадений, аналитические запросы и пакетный режим работы.
cat API — набор функций API, оптимизированных для использования в текстовой консоли. Предназначены для администрирования и поиска/исправления проблем на кластере.
Federated search — специальный узел, способный одновременно быть членом нескольких не связанных между собой кластеров. Позволяет распределять по разным кластерам большую часть операций поиска и индексирования.

Изменения, которые необходимо учесть при обновлении с версии 0.90, описаны в документации.

>>> Подробности

Ссылка

← Вышел стабильный релиз WildFly 8

FreeMind 1.0.0 →

ждём на ЛОРе, чё.

cetjs2 ★★★★★
(12.02.14 23:38:23 MSK)
Последнее исправление: cetjs2 12.02.14 23:38:42 MSK (всего исправлений: 1)

Ответ на: комментарий от cetjs2 12.02.14 23:38:23 MSK

мне и с 0.90 пока хорошо, не буду торопиться

maxcom ★★★★★
(12.02.14 23:39:14 MSK) автор топика

ниче такая библиотечка поиска на полмиллиона строк кода.

crowbar ★
(12.02.14 23:45:34 MSK)

Ссылка

А как в нём с CJK? Fuzzy-search есть?

mega_venik ★★★★
(12.02.14 23:51:45 MSK)

Ответ на: комментарий от mega_venik 12.02.14 23:51:45 MSK

А как в нём с CJK? Fuzzy-search есть?

Есть большая часть того, что умеет Lucene. Fuzzy search точно есть, а CJK я не интересовался, не знаю.

maxcom ★★★★★
(12.02.14 23:54:14 MSK) автор топика

Ссылка

вроде классная штука, но пока не пробовал, как то сфинкса хватает.

umren ★★★★★
(13.02.14 00:04:12 MSK)

Ссылка

Ответ на: комментарий от maxcom 12.02.14 23:39:14 MSK

А вроде когда-то на лоре Solr был? А почему перешли? Сам использую Solr.

goingUp ★★★★★
(13.02.14 00:10:53 MSK)

выполнения аналитических запросов в реальном времени

Судя по написанному в документации, никаким «реальным временем» не пахнет даже близко, не описано там никаких решений, которые могут дать быструю агрегацию. Для поиска может подойдет, но на аналитику, имхо, они зря тратят время с таким подходом.

ForwardToMars ★
(13.02.14 00:20:16 MSK)

Ссылка

хорошая штукенция, использовал 0.90 в как backend для GrayLog2

jekader ★★★★★
(13.02.14 00:31:20 MSK)

Ссылка

Ответ на: комментарий от cetjs2 12.02.14 23:38:23 MSK

ухаха!)) не дождетесь! здесь годами ничего не меняется)))

Indexator ★★★
(13.02.14 00:54:51 MSK)

Ссылка

Ответ на: комментарий от mega_venik 12.02.14 23:51:45 MSK

CJK есть, fuzzy есть

romanovsky
(13.02.14 01:57:46 MSK)

Ссылка

Ответ на: комментарий от maxcom 12.02.14 23:39:14 MSK

Я на 1.0 уже пару месяцев сижу. Оно субъективно стабильнее 0.90.7. Ури хлестался, что оно и быстрее стало.

romanovsky
(13.02.14 02:02:37 MSK)

Ссылка

Ответ на: комментарий от maxcom 12.02.14 23:39:14 MSK

лор использует ES? для чего, если не секрет?

val-amart ★★★★★
(13.02.14 02:47:13 MSK)

Пока посижу на 0.90, может после релиза проапдейтимся

val-amart ★★★★★
(13.02.14 02:47:37 MSK)

Ссылка

Java? Не нужно. Есть Apache Lucy (не путать с Lucene) на кошерной сишечке.

anonymous
(13.02.14 05:09:37 MSK)

Ответ на: комментарий от anonymous 13.02.14 05:09:37 MSK

Лор тоже на java.

Deleted
(13.02.14 06:16:16 MSK)
Последнее исправление: Deleted 13.02.14 06:16:25 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от val-amart 13.02.14 02:47:13 MSK

«поиск» и «похожие темы»

maxcom ★★★★★
(13.02.14 08:40:59 MSK) автор топика

Ответ на: комментарий от val-amart 13.02.14 02:47:13 MSK

Для полнотекстового поиска.

К.О.

BattleCoder ★★★★★
(13.02.14 10:18:08 MSK)

Ссылка

Ответ на: комментарий от maxcom 13.02.14 08:40:59 MSK

Похожие темы не так давно появились ведь? Помню, раньше не было...

BattleCoder ★★★★★
(13.02.14 10:18:57 MSK)

Ссылка

простое REST API

API — мужского рода.

Apple-ch ★★
(13.02.14 10:30:46 MSK)

Ссылка

Ответ на: комментарий от goingUp 13.02.14 00:10:53 MSK

Хотелось получить опыт использования Elasticsearch. Для l.o.r в принципе не важно solr или эластик, так как узел один и не нужны всякие сложности вроде партиционирования индекса.

maxcom ★★★★★
(13.02.14 10:44:41 MSK) автор топика

Ответ на: комментарий от maxcom 13.02.14 10:44:41 MSK

Для l.o.r в принципе не важно solr или эластик, так как узел один и не нужны всякие сложности вроде партиционирования индекса.

вот у меня два поисковых сервера, как раз elastic и solr, solr используется для пяти сайтиков на drupal'е, elastic для одного на джанге. Нагрузки большой вроде не предвидится, соответственно и кластеризации тоже. Я правильно понимаю, что раз нет кластеризации, то и разницы нет, и эластик можно выкинуть смело?

RedPossum ★★★★★
(13.02.14 11:56:31 MSK)

Ссылка

А зачем нужен Эластик, когда есть Lucene/Solr?

Что используется для хранения индекса - Lucene с его системой, когда индекс может обновить только одна нода, или что-то более продвинутое?

VoDA ★★
(13.02.14 12:25:50 MSK)

Ответ на: комментарий от VoDA 13.02.14 12:25:50 MSK

Что используется для хранения индекса - Lucene с его системой, когда индекс может обновить только одна нода, или что-то более продвинутое?

Индекс режется на части и распределяется по узлам. Плюс еще есть репликация, т.е. копии индекса могут хранится на нескольких узлах одновременно.

maxcom ★★★★★
(13.02.14 13:06:44 MSK) автор топика

Ответ на: комментарий от maxcom 13.02.14 13:06:44 MSK

а что его хранит куски индекса? HDFS?

VoDA ★★
(13.02.14 13:39:17 MSK)

Ответ на: комментарий от maxcom 13.02.14 08:40:59 MSK

но ведь это можно не менее удобно сделать на чистом lucene и без эластика?

val-amart ★★★★★
(13.02.14 13:49:28 MSK)

Ответ на: комментарий от VoDA 13.02.14 13:39:17 MSK

а что его хранит куски индекса? HDFS?

Локальная файловая система, на каждом узле своя. Там есть еще какие-то варианты для облачных провайдеров, но я туда не копал

maxcom ★★★★★
(13.02.14 14:48:39 MSK) автор топика

Ссылка

Ответ на: комментарий от val-amart 13.02.14 13:49:28 MSK

но ведь это можно не менее удобно сделать на чистом lucene и без эластика?

можно, но это довольно объемная задача

maxcom ★★★★★
(13.02.14 14:49:09 MSK) автор топика

Ссылка

Ответ на: комментарий от val-amart 13.02.14 13:49:28 MSK

но ведь это можно не менее удобно сделать на чистом lucene и без эластика?

Это вариант для тех, кто не боится писать код.

anonymous
(13.02.14 18:18:24 MSK)

Ссылка

В чятик призывается дух Луговского.

anonymous
(13.02.14 23:58:08 MSK)

Ссылка

гуглокапец?

ЗЫ Не понял по каким данным и в какой форме они хранятся...

I-Love-Microsoft ★★★★★
(14.02.14 01:18:02 MSK)
Последнее исправление: I-Love-Microsoft 14.02.14 01:19:11 MSK (всего исправлений: 1)

Ссылка

Круто, надо будет обновить, вместе с logstash и kibana.

Hoodoo ★★★★★
(14.02.14 13:52:24 MSK)

Ссылка

люблю опенсорс, но уже внедрил и окупил Splunk. Умеет намного больше из коробки и в реальном времени.

anonymous
(14.02.14 17:24:26 MSK)

А как он в сравнении со стариком sphinx? Кто что скажет?

ChAnton ★★
(15.02.14 12:49:01 MSK)

Ссылка

Ответ на: комментарий от anonymous 14.02.14 17:24:26 MSK

люблю опенсорс, но уже внедрил и окупил Splunk. Умеет намного >больше из коробки и в реальном времени.

Насчет «намного больше»-это несколько преждевременное заявление, которое не совсем соответствует действительности. К тому же понятие «из коробки» непременно тянет за собой неприятный шлейф, включающий в себя целый комплекс выводов. Таких как некомпетентность пользователей, небезопасность использования итд итп...

ChAnton ★★
(15.02.14 12:51:26 MSK)
Последнее исправление: ChAnton 15.02.14 12:52:37 MSK (всего исправлений: 2)

Ответ на: комментарий от ChAnton 15.02.14 12:51:26 MSK

Фантазёры, любящие позагибать пальцы и отодвинуть сроки, слава Богу, не привлекались. Хватило привлечения архитекторов от вендора и стека процессов поддержки и развития, отданных в эксплуатацию.

anonymous
(16.02.14 01:02:54 MSK)

Ответ на: комментарий от anonymous 16.02.14 01:02:54 MSK

Фантазёры, любящие позагибать пальцы и отодвинуть сроки, >слава Богу, не привлекались. Хватило привлечения архитекторов >от вендора и стека процессов поддержки и развития, отданных в >эксплуатацию.

Да я не о разработчиках, а о тех, кто эсплуатирует. Не надо преувеличивать значимость проприетарщины. В ней одни минусы, когда начинаешь касаться всех перечисленных ранее аспектов.

ChAnton ★★
(16.02.14 12:53:50 MSK)

Ссылка

Ответ на: комментарий от val-amart 13.02.14 13:49:28 MSK

пробовали использовать Lucene как библиотеку, вот только есть уйма нюансов, если просто посторить индекс внутри приложения особой разницы нет, кроме скорости индексирования, так как elasticsearch многопоточный и позволяет использовать ресурсы на 100%, а вот когда вы захотите перестраивать индекс и чтобы поиск при этом продолжал работать или сделать приложение более легким и вынести поиск в сервис, что вполне логично, обеспечить ha и балансировку, backup restore, начнете использовать фильтры для увеличения скорости поиска, то в определенный момент поймете что пишете свой elasticsearch...

kem
(17.02.14 11:12:52 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Вышел стабильный релиз WildFly 8

Open Source

FreeMind 1.0.0 →