Выбор JSON DB

2

4

Значится, под задачу хранения метаданных файлов нужно выбрать базу.
Поскольку данные могут быть разные - schema-based хранилища не подходят.
Нужна скорость + гибкость поиска по полям. Аггрегация и mapreduce не нужны.

Варианты:

1) mongodb. плюсы: скорость, простота поисков по вложенным полям. минусы: ненадежность и общее недоверие к проекту. отвратительный коннектор для nginx-lua.

2) couchdb. плюсы: надежность и консистентность, простота апи. минусы: для всего нужны вьюхи через map(reduce). обновляются они не особо шутро. требует переодической ручной чистки.

3) postgres. плюсы: скорость, надежность. минусы: сложность настройки в целом и вакуума в частности. ну и, я с ним никогда особо не работал. плюс по докам не очень понятно, что там с индексацией вложенных полей в json.

4) mysql, лол. плюсы: простота. минусы: индексить вложенные поля можно только через автогенерированные колонки, насколько я понял. ну и, оракаль, ибо в марии с json все плохо пока.

Я пока склоняюсь в сторону постгресса.
Мнения?

Ссылка

←	Простой слайдер

Morfy - OPEN SOURCE CMS

→

Правильный выбор.

kardapoltsev ★★★★★
(18.10.15 20:41:51 MSK)

Ссылка

требует переодической ручной чистки.

Можно настроить демон для автоматической чистки (https://wiki.apache.org/couchdb/Compaction#Automatic_Compaction).

Ja-Ja-Hey-Ho ★★★★★
(18.10.15 20:47:14 MSK)
Последнее исправление: Ja-Ja-Hey-Ho 18.10.15 20:48:04 MSK (всего исправлений: 1)

Ответ на: комментарий от Ja-Ja-Hey-Ho 18.10.15 20:47:14 MSK

Да, но там в целом есть проблема с быстротой доступности данных во вьюхах после инсерта/апдейта на большом количестве данных.

iSage ★★★★
(18.10.15 22:49:07 MSK) автор топика

Ссылка

Про вакуум в пг слышал только звон?

anonymous
(19.10.15 10:38:02 MSK)

Ссылка

Я бы рекомендовал постгрес из следующих соображений, сейчас тебе не нужна реляционная бд, ну отлично, ты можешь пользовать потгрес как жсон хранилище, но вот когда (не если, а именно когда) тебе вдруг понадобятся фичи реляционных бд, то тебе не придётся всё переделывать.

Лучше иметь фичу которую не используешь, чем не иметь фичи которая нужна.

ya-betmen ★★★★★
(20.10.15 13:24:43 MSK)
Последнее исправление: ya-betmen 20.10.15 13:25:53 MSK (всего исправлений: 1)

Ответ на: комментарий от ya-betmen 20.10.15 13:24:43 MSK

Ну, по тому же принципу можно выбрать монгу. Map-reduce мне понадобится с куда большей вероятностью, нежели реляционная бд.

iSage ★★★★
(20.10.15 16:59:45 MSK) автор топика

Ответ на: комментарий от iSage 20.10.15 16:59:45 MSK

elasticsearch?

zunkree ★
(20.10.15 17:01:24 MSK)

Ссылка

Лол: https://github.com/typicode/json-server.

xenohunter
(20.10.15 17:12:26 MSK)

postgres вызывает больше всего доверия.

по докам не очень понятно, что там с индексацией вложенных полей в json.

http://www.postgresql.org/docs/9.4/static/datatype-json.html это не то?

pawnhearts ★★★★★
(20.10.15 17:29:33 MSK)

Ответ на: комментарий от iSage 20.10.15 16:59:45 MSK

http://www.sarahmei.com/blog/2013/11/11/why-you-should-never-use-mongodb/

Deleted
(20.10.15 17:33:21 MSK)

Ответ на: комментарий от Deleted 20.10.15 17:33:21 MSK

Одна из этих статей где взяли монгу, потому что это модно и использовали её неправильно с неправильной структурой бд, а вообще надо было брать реляционную базу и не выпендриваться. Но это не значит, что она нигде не преминима.

Map-reduce мне понадобится

Кстати, последний раз когда я с монгой игрался(несколько лет назад), из-за немного неправильно macreduce запроса монга просто падала. Да и небыстро работало оно.

pawnhearts ★★★★★
(20.10.15 17:39:44 MSK)

Ответ на: комментарий от pawnhearts 20.10.15 17:39:44 MSK

Плюсую. Каждому инструменту - своё применение.

По производительности MongoDB выросла в последнее время. Мы вот в продакшене для некритичных данных (пользовательские настройки интерфейса web-приложения) используем.

xenohunter
(20.10.15 17:43:24 MSK)

Ссылка

Ответ на: комментарий от pawnhearts 20.10.15 17:29:33 MSK

Там нету примера для составного индекса, например, по двум и более полям. А также никаких указаний насколько это эффективно тоже нет.

~~gh0stwizard~~ ★★★★★
(20.10.15 19:26:55 MSK)

Ссылка

Ответ на: комментарий от pawnhearts 20.10.15 17:29:33 MSK

Это оно, да. Но вопрос не в этом.
Согласно http://www.postgresql.org/docs/9.4/static/functions-json.html поиска по составным ключам нет. Как и поиска по частичному вхождению значения.

iSage ★★★★
(20.10.15 23:37:37 MSK) автор топика

Ссылка

Ответ на: комментарий от xenohunter 20.10.15 17:12:26 MSK

Офигеть какая эффективность. Хранить в текстовом файлике.
Это я и в марии через connect могу, да и вообще без сервера.
А искать по этому говну предлагается, видимо, через греп, да?

iSage ★★★★
(20.10.15 23:40:05 MSK) автор топика

Я, на самом деле, пока остановился на монге, если осилю написать человеческий драйвер для нее под nginx-lua.
В конце-концов данные не особо критичные.

iSage ★★★★
(20.10.15 23:41:46 MSK) автор топика

Ссылка

Ответ на: комментарий от pawnhearts 20.10.15 17:39:44 MSK

mapreduce в принципе не особо быстр на большом количестве данных. с другой стороны, не то, чтобы оно сильно нужно было для реалтайма, ибо в основном аналитика всякая.

iSage ★★★★
(20.10.15 23:44:06 MSK) автор топика

Ссылка

Ответ на: комментарий от iSage 20.10.15 23:40:05 MSK

Это шутка была, вообще-то. Специально же «лол» написал. Что ж так серьёзно?

xenohunter
(21.10.15 00:59:06 MSK)

Ссылка

Ответ на: комментарий от iSage 20.10.15 16:59:45 MSK

можно выбрать монгу. Map-reduce мне понадобится с куда большей вероятностью

Если монгу не выбирать то и не понадобится. Map-reduce нужен для распределённых хранилищ, это не фича это костыль.

ya-betmen ★★★★★
(21.10.15 03:01:30 MSK)

Ответ на: комментарий от ya-betmen 21.10.15 03:01:30 MSK

Угу, ведь куда проще заранее знать все нужные индексы и написать простыню аггрегационного непараллелющегося запроса на sql.

iSage ★★★★
(21.10.15 09:57:37 MSK) автор топика

Ответ на: комментарий от iSage 21.10.15 09:57:37 MSK

Я не понимаю на что ты возражаешь. Во-первых, мап-редьюс это просто метод поиска по неструктурированным хранилищам, нет такого хранилища - не нужен такой метод поиска. Во-вторых параллелится или нет запрос совершенно не важно, важна скорость его работы, тормозной запрос можно и так и так написать. Наконец, я высказал собственное мнение по этому вопросу, соглашаться или нет - дело твоё, но если причины возражения не технические, то их лучше просто не писать.

ya-betmen ★★★★★
(21.10.15 10:20:11 MSK)

Ответ на: комментарий от ya-betmen 21.10.15 10:20:11 MSK

мап-редьюс это просто метод поиска по неструктурированным хранилищам

Садись, двойка.

iSage ★★★★
(22.10.15 13:36:53 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Простой слайдер

Web-development

Morfy - OPEN SOURCE CMS

→

Похожие темы