Zookeeper в качестве in memory cache.

0

1

К работавшим с zk/hadoop вопрос. Есть проект, в нем уже используется zk, поскольку данные сервак частично получает через apache kafka. Адекватно ли будет его так-же использовать под кэш некоторго, не очень большого по объему количества данных (веб-сессии, справочники, к которым часто обращается сервак для вычислений итд.)? Или все таки лучше прикрутить под это что-то отедльное, типа редиски?

Ссылка

←	IntelliJIdea+Equinox=Error eclipse.buildId=unknown

Непонятки с вызовом метода __init__, определённого для предка

→

zookeeper медленный

maxcom ★★★★★
(24.02.15 17:18:01 MSK)

Ответ на: комментарий от maxcom 24.02.15 17:18:01 MSK

А насколько, если не секрет? Как я понял из того, что нагуглил - он явно быстрее субд.

Nagwal ★★★★
(24.02.15 17:21:16 MSK) автор топика

Ответ на: комментарий от Nagwal 24.02.15 17:21:16 MSK

В Zookeeper внутри Paxos. Скажи зачем тебе он для кеша

~~vertexua~~ ★★★★★
(24.02.15 17:24:20 MSK)

Ответ на: комментарий от Nagwal 24.02.15 17:21:16 MSK

Примерно 1000 запросов в секунду выдаст? Больше в обозримом будущем вряд-ли потребуется. Я бы вообще не заморачивался с кешированием, но субд периодически может быть загружена по уши записью данных и не хочется ее грузить дополнительно.

Nagwal ★★★★
(24.02.15 17:25:09 MSK) автор топика

Ответ на: комментарий от vertexua 24.02.15 17:24:20 MSK

Для кеша он мне и не нужен. Просто есть необходимость вытащить некоторое количество данных из базы во что-то побыстрее, а zk уже используется в проекте. Не хочется плодить лишних сущностей.

Nagwal ★★★★
(24.02.15 17:28:06 MSK) автор топика

Ответ на: комментарий от Nagwal 24.02.15 17:28:06 MSK

Он совсем не для того, так как в нем Paxos, то будет сильнейший боттлнек на запись. Но в плане чтения он все же может быть очень быстрым, как любое in-memory хранилище

~~vertexua~~ ★★★★★
(24.02.15 17:29:38 MSK)

лучше поставь нормальный кеш и не парь мозга себе - быстрее будет :)

shty ★★★★★
(24.02.15 17:35:25 MSK)

Ссылка

Ответ на: комментарий от Nagwal 24.02.15 17:28:06 MSK

Не хочется плодить лишних сущностей.

сказал боцман и засунул ложку с едой в задницу...

shty ★★★★★
(24.02.15 17:36:42 MSK)

Ссылка

Ответ на: комментарий от vertexua 24.02.15 17:29:38 MSK

Ну, количество операций записи именно сессий/справочников измеряется единицами в минуту. Это не публичный сервер, а внутреннее решение. Т.е. одновременных клиентов максимум сотня, веб-сессии могут вообще месяцами могут висеть без изменений. Справочники тоже редактируются крайне редко. Возможно что будет довольно много данных из очереди (от приборов, система - что то типа мониторинга), но они пойдут напрямую в базу и в кеше им делать совершенно нечего.

Nagwal ★★★★
(24.02.15 17:39:17 MSK) автор топика

Ответ на: комментарий от Nagwal 24.02.15 17:39:17 MSK

Т.е. одновременных клиентов максимум сотня, веб-сессии могут вообще месяцами могут висеть без изменений.

зачем для этого вообще нужно хранить сессии в выделенном хранилище? sticky sessions вполне достаточно же.

а справочники вообще обычно можно не синхронизировать, т.е. хранить себе в локальной памяти и пусть протухают по таймауту.

maloi ★★★★★
(24.02.15 20:44:12 MSK)

Ответ на: комментарий от maloi 24.02.15 20:44:12 MSK

зачем для этого вообще нужно хранить сессии в выделенном хранилище? sticky sessions вполне достаточно же.

Не, не достаточно, там лежит кое-какие данные, которые нужны в.т.ч. серваку. Ну и клиенты не должны отцепляться от сервера в случае его перезагрузки, т.е. какое то хранилище нужно.

а справочники вообще обычно можно не синхронизировать, т.е. хранить себе в локальной памяти и пусть протухают по таймауту.

Думал над таким вариантом, в принципе подойдет конечно, но вариант с быстрым кэшем мне пока нравится больше.

Nagwal ★★★★
(24.02.15 21:46:15 MSK) автор топика

Ответ на: комментарий от Nagwal 24.02.15 21:46:15 MSK

Не, не достаточно, там лежит кое-какие данные, которые нужны в.т.ч. серваку. Ну и клиенты не должны отцепляться от сервера в случае его перезагрузки, т.е. какое то хранилище нужно.

ну значит ты нагородил какую-то ерунду и теперь пытаешься её разрулить при помощи ещё одной ерунды.

Вообще сейчас модно хранить все данные сессии в куках, при необходимости подписывая/шифруя то что не должно быть доступно клиенту. Тогда на сервере вообще в принципе не нужна никакая синхронизация сессий. Если у тебя правда в сессии мало данных как ты недавно говорил - это вполне вариант.

maloi ★★★★★
(24.02.15 21:57:53 MSK)

Ответ на: комментарий от maloi 24.02.15 21:57:53 MSK

Вообще сейчас модно хранить все данные сессии в куках, при необходимости подписывая/шифруя то что не должно быть доступно клиенту.

Нет, не вариант. Данные нужны именно серверу. Например в сессии лежит список устройств, которые клиент выкинул на экран (скриншот: http://s11.postimg.org/kkyizq6ub/Untitled.png ) по которому определяется, какие данные ему надо гнать через вебсокет (все гнать не вариант, устройств может быть дофига).

Nagwal ★★★★
(24.02.15 22:06:09 MSK) автор топика

Ответ на: комментарий от Nagwal 24.02.15 22:06:09 MSK

Нет, не вариант. Данные нужны именно серверу.

ну так клиент их при установке соединения и пошлет. даже если сервер выключится - клиенту нужно будет перестанавливать соединение => перепосылать куки и список устройств в них. никакого волшебства.

maloi ★★★★★
(24.02.15 22:45:29 MSK)

Ответ на: комментарий от maloi 24.02.15 22:45:29 MSK

Клиент то их пошлет, не вопрос. А дальше мне их надо будет куда-то положить. Чтобы при отправке данных на клиент сервер смог их откуда-то достать. Т.е. данные пушатся с сервера, через вебсокет, _без_ предварительного запроса с клиентской стороны. Можно перевязку клиента с устройствами хранить конечно в базе или просто в оперативке, но имхо в сессии проще.

Nagwal ★★★★
(24.02.15 22:55:58 MSK) автор топика

Ссылка

Ответ на: комментарий от Nagwal 24.02.15 17:25:09 MSK

Выдаст. 10000 выдаст легко, а если на ssd поставить, то больше. Только учти, что он не любит когда база растет и когда между нодами большие задержки. Стоит рассчитывать на максимум 300-400 мегабайт на базу, дальше придется танцевать с бубном вокруг настроек и мириться с проседанием производительности.

Reset ★★★★★
(24.02.15 23:48:55 MSK)

Ответ на: комментарий от Reset 24.02.15 23:48:55 MSK

Кстати если у тебя в одном zk будет жить кафка и твой проект, то надо быть очень аккуратным. Если zk поставишь раком, то кафка может уйти в расколбас с потерей данных в итоге.

Reset ★★★★★
(24.02.15 23:52:59 MSK)

Ответ на: комментарий от Reset 24.02.15 23:52:59 MSK

Если zk поставишь раком, то кафка может уйти в расколбас с потерей данных в итоге.

Угу, я уже заметил капризность всего этого хозяйства. Оно у меня например периодически после остановки в дебагере отваливается так, что только перезапуск сервера (моего сервера, который kafka consumer) помогает.

Кстати, если уж с кафкой приходилось работать, еще вопрос - можно ее consumer-у скормить при инициализации готовый коннект к zk? Желательно без грязных хаков типа раскопок в ее исходниках.

Nagwal ★★★★
(25.02.15 00:44:33 MSK) автор топика

Ответ на: комментарий от Reset 24.02.15 23:48:55 MSK

Стоит рассчитывать на максимум 300-400 мегабайт на базу

Там данных справочников максимум 20-30 мегабайт в среднем наберется, вряд ли больше. Еще сессии могут метров 10 занять. Так что вроде влезаю.

Nagwal ★★★★
(25.02.15 00:54:33 MSK) автор топика

Ответ на: комментарий от Nagwal 25.02.15 00:44:33 MSK

Кстати, если уж с кафкой приходилось работать, еще вопрос - можно ее consumer-у скормить при инициализации готовый коннект к zk? Желательно без грязных хаков типа раскопок в ее исходниках.

Есть SimpleConsumer на базе которого можно написать своего. С ZookeeperWTFConsumer слишком много проблем, я его использовать не смог.

Reset ★★★★★
(25.02.15 11:05:21 MSK)

Ответ на: комментарий от Nagwal 25.02.15 00:54:33 MSK

Еще сессии могут метров 10 занять

В zk одна нода не может хранить больше 1M данных.

Reset ★★★★★
(25.02.15 11:06:10 MSK)

Ответ на: комментарий от Reset 25.02.15 11:06:10 MSK

В zk одна нода не может хранить больше 1M данных.

Я в курсе. 20-30 мб это всего справочников. Естественно они будут раскиданы по разным нодам.

Nagwal ★★★★
(25.02.15 11:22:49 MSK) автор топика

Ссылка

Ответ на: комментарий от Reset 25.02.15 11:05:21 MSK

Есть SimpleConsumer на базе которого можно написать своего. С ZookeeperWTFConsumer слишком много проблем, я его использовать не смог.

Ок, ясно, спасибо

Nagwal ★★★★
(25.02.15 11:26:02 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	IntelliJIdea+Equinox=Error eclipse.buildId=unknown

Development

Непонятки с вызовом метода __init__, определённого для предка

→

Похожие темы