[ диванный хайлоад ] Сравнение PostgreSQL и MongoDB

0

1

Сап, Лорчан.
В больном мозге родилась идея из серии «сравнить ежа и ужа». Что я хочу выяснить в ходе эксперимента:
- Cравнение скорости работы этих БД в режиме использования MongoDB как базы с фиксированной структурой данных, то бишь, повторяющим структуру таблиц в Postgres.
- Сравнение отказоусточивости (борьба с ломом в виде прибивания процесса БД на ноде, аки симуляция выпадения ноды).
- Общая скорость и надёжность синхронизации данных между нодами, выбор оптимальных режимов репликации, восстановление данных на ноде при выпадении при записи и всё такое.
Если это всё же имеет смысл, вторая часть вопроса: из железа имеются два ноута и два системника с весьма разношёрстными кишками и д-линковский свич 100 Мбит для их соединения. План таков: одна машина будет «сервером приложений», три остальных - нодами базы данных. Первая машина будет выполнять выборки, запись, замеры, остальные - просто будут «кластером» БД. Так вот, имеет ли смысл проводить эксперимент на таком железе, или лучше снять 4 виртуальных машины на каком-нибудь хостинге? Разумеется, с локальной сетью между машинами. В остальном, реквестирую соображения по методикам тестирования и общей вменяемости затеи.

P.S:
Запостил в толкс, потому что не вижу особо технических вопросов, если неправ - переместите в более подходящий раздел.

Ссылка

← футболка ЛОР

[arch][appmenu][HUD][libreoffice]Куда зарепортить баг? →

Сравнение СУБД разных парадигм это конечно бред, но глянуть результаты все равно было бы интересно.

Dobriy_i_Prostoy ★
(20.03.12 07:07:53 MSK)

Ссылка

Предположительно, в качестве ORM хочу использовать MongoEngine и SQLAlchemy.

jessey
(20.03.12 08:04:33 MSK) автор топика

идея попахивает бредом немного, но я сторонник мнения «больше тестов, хороших и разных». Так что - делай тесты, а там коммьюнити рассудит. На крайняк - даже если и получится говно - всегда можно запостить на фороникс ;-)

Pinkbyte ★★★★★
(20.03.12 08:40:50 MSK)

Ссылка

заодно протестируй эти субд на разных дистрибутивах GNU Linux и на FreeBSD. и тоже на фороникс.

Komintern ★★★★★
(20.03.12 08:56:40 MSK)

Ответ на: комментарий от Komintern 20.03.12 08:56:40 MSK

также предлагаю тестировать с большим количеством баз (~3000)

Komintern ★★★★★
(20.03.12 09:02:15 MSK)

Ответ на: комментарий от Komintern 20.03.12 09:02:15 MSK

Может и набор тестовых данных посоветуешь?

jessey
(20.03.12 09:03:24 MSK) автор топика

[ диванный хайлоад ] Сравнение Огурцов и Картошки

Fxd.

AlexVR ★★★★★
(20.03.12 09:10:42 MSK)

Ответ на: [ диванный хайлоад ] Сравнение Огурцов и Картошки от AlexVR 20.03.12 09:10:42 MSK

Сумничал, ня?

jessey
(20.03.12 09:13:08 MSK) автор топика

Ссылка

Ответ на: комментарий от Komintern 20.03.12 09:02:15 MSK

какой в єтом смьісл?

// я серьезно

ZuBB ★★★★★
(20.03.12 09:19:41 MSK)

PostgreSQL выйграет )

nCdy ★
(20.03.12 09:28:45 MSK)

Ты еще запросы на них поделай и поймешь, что они разные.

~~demmsnt~~ ★
(20.03.12 09:32:11 MSK)

Ответ на: комментарий от jessey 20.03.12 09:03:24 MSK

Могу дать тебе базу ulogd

~~demmsnt~~ ★
(20.03.12 09:32:36 MSK)

Ответ на: комментарий от demmsnt 20.03.12 09:32:11 MSK

Я в курсе же. Потому и ORM.

jessey
(20.03.12 09:32:46 MSK) автор топика

Ссылка

Ответ на: комментарий от demmsnt 20.03.12 09:32:36 MSK

Гугл сказал что это логгер который умеет логировать в базу. И как, большая? Сложные связи есть?

jessey
(20.03.12 09:34:22 MSK) автор топика

Ответ на: комментарий от ZuBB 20.03.12 09:19:41 MSK

смысл в том, чтобы сравнить эффективность работы механизма кеширования.

Komintern ★★★★★
(20.03.12 09:52:12 MSK)

Ответ на: комментарий от jessey 20.03.12 09:03:24 MSK

скрипт напиши, который будет забивать таблицы рандомными данными.

Komintern ★★★★★
(20.03.12 09:52:44 MSK)

Ответ на: комментарий от Komintern 20.03.12 09:52:44 MSK

Это очевидно. Но для начала хочется послушать, может чего предложат более интересного.

jessey
(20.03.12 09:53:48 MSK) автор топика

Ссылка

Ответ на: комментарий от Komintern 20.03.12 09:52:12 MSK

А с одной базой но большим обьемом данньіх нельзя проверить то же самое?

ZuBB ★★★★★
(20.03.12 10:05:20 MSK)

Ответ на: комментарий от ZuBB 20.03.12 10:05:20 MSK

можно =) но я подхожу к вопросу со стороны масового хостинга (работа сказывается, будь она неладна), поэтому условия с большим количеством баз и таблиц, но относительно небольшим обьемом информации в каждом - более приближены к реальным в моем случае. хотя с другой стороны монго на масовом хостинге это как-то дико.

Komintern ★★★★★
(20.03.12 10:08:13 MSK)

Ссылка

Ответ на: комментарий от nCdy 20.03.12 09:28:45 MSK

PostgreSQL выйграет )

Пока для общей структуры БД будет хватать памяти.

Сравнение СУБД разных парадигм это конечно бред

Фигасе! Сравнение СУБД одинаковых парадигм не более чем проверка качества реализации СУБД, а в данном случае это сравнение парадигм.

ТС, проверь ещё сколько занимает разработка, т.е. в сколько строк кода и какой сложности укладываются типовые сложные запросы.

PS: Mongo зарулит по скорости.

iBliss ★
(20.03.12 10:28:00 MSK)

Ответ на: комментарий от iBliss 20.03.12 10:28:00 MSK

ТС, проверь ещё сколько занимает разработка, т.е. в сколько строк кода и какой сложности укладываются типовые сложные запросы.

Но я же буду использовать ORM, так что кол-во кода должно не сильно отличаться.

jessey
(20.03.12 10:30:52 MSK) автор топика

Ответ на: комментарий от jessey 20.03.12 09:34:22 MSK

конечно нет. Но в куче и так связей нет.

в куче where иногда делать очень сложно.

Зато можно в одной куче хранить сложные объекты.

Например вот у меня: [code=JavaScript]

{ «_id»: «productsPage», «_rev»: «12-c0aed325ce90ccc45503093b67c54e6a», «edit_template»: «chapters_edit.html», «childs»: [ [ «tablo», «productsPage:tablo» ], [ «clocks», «productsPage:clocks» ], [ «scan_101», «productsPage:scan_101» ], [ «switches», «productsPage:switches» ], [ «sunon», «productsPage:sunon» ] ], «name»: «products», «title»: «Продукты», «ctype»: «IBlog», «template»: «chapter_pages.html» }

[/code]

Для этого на Postgre одной таблицей не обойтись.

~~demmsnt~~ ★
(20.03.12 10:42:30 MSK)

Ссылка

Ответ на: комментарий от jessey 20.03.12 10:30:52 MSK

Но я же буду использовать ORM, так что кол-во кода должно не сильно отличаться.

Тоды ой. Но тогда какой это хайлоад?

iBliss ★
(20.03.12 10:43:40 MSK)

Ответ на: комментарий от iBliss 20.03.12 10:43:40 MSK

Диванный, очевидно. В принципе, можно сделать два варианта: с ORM и с чистыми запросами.

2demmsnt:
Так не одна таблица предполагается. Пока думаю над вариантом избитого блогоподобного нечта: записи, камменты к ним, возможно, теги, дата и прочее. И выборка по всему этому. Сейчас думаю как генерить набор данных.

jessey
(20.03.12 10:46:59 MSK) автор топика

Ответ на: комментарий от jessey 20.03.12 08:04:33 MSK

в качестве ORM хочу использовать MongoEngine и SQLAlchemy

А вот это определённо зря: так ты в значительной степени будешь тестировать ормы, а не субд.

Apple-ch ★★
(20.03.12 10:49:39 MSK)

Ответ на: комментарий от Apple-ch 20.03.12 10:49:39 MSK

ORM это инструмент, позволяющий удобно работать с БД, что уж тут поделать. Но повторюсь: думаю, можно сделать два цикла выборок: с ORM и без, на чистых запросах.

jessey
(20.03.12 10:57:35 MSK) автор топика

Ответ на: комментарий от jessey 20.03.12 10:46:59 MSK

Так возьми ulogd она большая и привяжи айпишники к организациям. Типа организация A Имеет такие, а Б другие....

Но еще раз говорю - в Couch ты это оформишь соооооооооовсем по другому. И Couch хранит версии. Получается, что мы сравниваем бульдога с носорогом.

Коуч удобна для хранения таких развесистых документов с полями типа массивов и словарей. Почти идеальна для всяких Wiki или CMS.

А для 1 млн записей по трафику совсем не удобна

~~demmsnt~~ ★
(20.03.12 12:42:29 MSK)

Ответ на: комментарий от jessey 20.03.12 10:57:35 MSK

И еще про ОРМ. Я из БД (Couch) и так получаю Dict. Причем при моей организации это готовый объект, только методы добавь.

А вот с SQL пока соберем объект из 10 таблиц или пока разберем его в них.....

~~demmsnt~~ ★
(20.03.12 12:43:43 MSK)

Ссылка

Ответ на: комментарий от demmsnt 20.03.12 12:42:29 MSK

Про коуч речи не идёт. Монго же возвращает объект курсора.

jessey
(20.03.12 12:45:13 MSK) автор топика

Ответ на: комментарий от jessey 20.03.12 12:45:13 MSK

Лопни мои глаза! Извини, промазал....

~~demmsnt~~ ★
(20.03.12 12:49:04 MSK)

Ответ на: комментарий от demmsnt 20.03.12 12:49:04 MSK

Бывает. Кстати, мне лично, Коуч не понравился почему-то. Как-то субъективно Монго приятнее.

jessey
(20.03.12 12:52:33 MSK) автор топика

Ответ на: комментарий от jessey 20.03.12 12:52:33 MSK

Я всякие говносайтики пишу. В Куче есть attacment это для меня решило вопрос. Правда с ними проблемы с русскими именами, но я нашел обход.

~~demmsnt~~ ★
(20.03.12 12:57:02 MSK)

Ответ на: комментарий от demmsnt 20.03.12 12:57:02 MSK

Аттач файла? Монго умеет GridFS с модулем для Nginx подгрузки файлов оттуда напрямую.

jessey
(20.03.12 12:59:00 MSK) автор топика

Ссылка

Ответ на: комментарий от jessey 20.03.12 08:04:33 MSK

в качестве ORM хочу использовать MongoEngine и SQLAlchemy.

boss_db поддерживает и ужа, и ежа.

shahid ★★★★★
(20.03.12 14:04:04 MSK)

Ответ на: комментарий от shahid 20.03.12 14:04:04 MSK

Проблема в том, что я не поддерживаю Erlang.

jessey
(20.03.12 14:05:20 MSK) автор топика

Ответ на: комментарий от jessey 20.03.12 14:05:20 MSK

Почитай туториал, тебе надо где-то строчек 10 кода написать самому, остальное нагенерируется boss-компилятором.

shahid ★★★★★
(20.03.12 14:06:13 MSK)

Ответ на: комментарий от shahid 20.03.12 14:06:13 MSK

Если бы у меня была практическая необходимость, я бы, безусловно, «асилил». Но для поиграться курить язык с нуля как-то не очень хочется. Не в этот раз.

jessey
(20.03.12 14:08:02 MSK) автор топика

Ответ на: комментарий от jessey 20.03.12 14:08:02 MSK

А в чем практическая необходимость сабжа? Просто если сходить с ума, то по-максимуму.

shahid ★★★★★
(20.03.12 14:15:07 MSK)

Ответ на: комментарий от jessey 20.03.12 14:08:02 MSK

Я даже знаю, какие будут результаты:

Постгрес с грохотом провалится в:
- Вопросах масштабирования. Слон немасштабируем (в современном смысле этого слова) даже если обвешать костылями.
- Скорость поиска данных по ключу.
- Ненужная мудотряска с ACL.

И постгрес выиграет в:
- простоте применения к аппликухам, сайтам типа ЛОРа и чуть выше.
- простоте писания, т.е. дешевизне разработки, ибо привычный SQL вместо какого-то непонятного js, mapreduce, etc.

shahid ★★★★★
(20.03.12 14:20:12 MSK)

Ответ на: комментарий от shahid 20.03.12 14:15:07 MSK

Что-то мне всё меньше и меньше охота проводить сие мероприятие =)

jessey
(20.03.12 14:21:28 MSK) автор топика

Ссылка

Ответ на: комментарий от shahid 20.03.12 14:20:12 MSK

не провалится, по крайней мере в скорости поиска данных по ключу.

nCdy ★
(20.03.12 14:29:57 MSK)

Ответ на: комментарий от nCdy 20.03.12 14:29:57 MSK

Это лишь если ключ целочисленный и табличка небольшая. А провалится он по простой причине:

PRIMARY KEY в постгресе хранится как столбец + unique-индекс. Т.е. данные ячеек хранятся два раза. Сначала будет проход по индексу, а потом поиск по полученному из индекса оффсету к данным. Т.е. на большом объеме данных, когда индекс фрагментирован и не влезает в RAM, будет непредсказуемое количество перемещений головки диска.

Чего не будет в монго-дб из-за сортировки данных в хранилищах и некоторых других приемов KV-хранилищ.

shahid ★★★★★
(20.03.12 14:40:38 MSK)

Ссылка

монго не умеет джоины в принципе, а постгрес не умеет мап-редьюс. Что ты сравнивать будешь? raw select запросы? Нет, такое исследование лишено смысла, увы.

~~JFreeM~~ ★★★☆
(20.03.12 14:55:10 MSK)

Ответ на: комментарий от JFreeM 20.03.12 14:55:10 MSK

Окай.

jessey
(20.03.12 15:01:56 MSK) автор топика

Ссылка

Сравнение грузовика и мотоцикла как раз в духе аватара ТС. Не нужно.

~~Saloed~~ ☆
(20.03.12 16:41:10 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← футболка ЛОР

Talks

[arch][appmenu][HUD][libreoffice]Куда зарепортить баг? →

[ диванный хайлоад ] Сравнение Огурцов и Картошки

Похожие темы