выбор базы данных

А так в принципе, поддерживаю предыдущего оратора, вполне можно забить на nosql, а банально взять постгрес. Если нормально спроектировать базу и не налегать на join-ы в частых запросах - проблем с производительностью не будет. Да и json/bson/xml поля никто не мешает использовать для данных с гибкой схемой.

Nagwal ★★★★
(21.06.14 11:54:43 MSK)

Ссылка

Посмотри http://docs.couchbase.com/

Правда транзакции там такие: http://docs.couchbase.com/couchbase-manual-2.5/cb-admin/#couchbase-views-samp...

monk ★★★★★
(21.06.14 12:16:16 MSK)
Последнее исправление: monk 21.06.14 12:19:55 MSK (всего исправлений: 1)

nosql

sql! все included.

umren ★★★★★
(21.06.14 12:26:09 MSK)

Ссылка

PostgreSQL.

транзакции
журналирование
быстрое чтение
неблокирующая заись

WAL и MVCC покрывают эти пункты.

подписка на изменения (желательно)

Есть; раньше можно было использовать триггеры и listen/notify, в версии 9.4 есть подписка на изменения (как часть протокола репликации).

c api

Эм, а есть СУБД без API?

кроссплатформенность (linux, windows)

Таки да.

не in-memory (данных не больше 100 gb)

dmitry_vk ★★★
(21.06.14 13:25:15 MSK)

Ссылка

Kyoto Tycoon

arson ★★★★★
(21.06.14 17:02:20 MSK)

Ссылка

Ответ на: комментарий от monk 21.06.14 12:16:16 MSK

Проще всё в один документ чаще запихнуть. Олсо были проблемы с java клиентами, но вполне оперативно фиксится.

anonymous
(21.06.14 17:09:43 MSK)

Ссылка

почему не mmap-нуть файл и не разместить там Posix hashtable

crowbar ★
(21.06.14 17:29:39 MSK)

Ссылка

orientdb

anonymous
(21.06.14 17:43:08 MSK)

Ссылка

Любая популярная БД может быть как NoSQL. Некоторые из них даже специально заточены.

Эрланг имеет неплохие встроенные реализации хранилищ - практически все, по твоим требованиям есть, остальное можно допилить. Насчет производительности не знаю.

swwwfactory ★★
(21.06.14 18:07:02 MSK)

Ссылка

Одновременно транзакций и неблокирующей записи не бывает. Толку от таких транзакций? Представь из нескольких потоков в разных транзакциях делают: update mytable set counter = counter + 1. Если не блокировать то будет просто last write win с потерей части апдейтов. Если нужно много апдейтов, то бери cassandra.

dizza ★★★★★
(22.06.14 02:03:09 MSK)

Ответ на: комментарий от dizza 22.06.14 02:03:09 MSK

Одновременно транзакций и неблокирующей записи не бывает. Толку от таких транзакций? Представь из нескольких потоков в разных транзакциях делают: update mytable set counter = counter + 1. Если не блокировать то будет просто last write win с потерей части апдейтов.

Путаешь уровни изоляции с блокировкой, это разные вещи.

~~mashina~~ ★★★★★
(22.06.14 02:11:14 MSK)

Ответ на: комментарий от mashina 22.06.14 02:11:14 MSK

Конечно разные. Но на практике я не встречал другого: все изестные мне реляционки блокируют или строку или таблицу на апдейт не зависимо от уровня изоляции.

dizza ★★★★★
(22.06.14 10:45:52 MSK)

Ответ на: комментарий от dizza 22.06.14 10:45:52 MSK

все изестные мне реляционки блокируют или строку или таблицу на апдейт

http://en.wikipedia.org/wiki/Multiversion_concurrency_control - там внизу список реляционок которые не блокируют

anonymous
(22.06.14 11:07:15 MSK)

Ответ на: комментарий от anonymous 22.06.14 11:07:15 MSK

MVCC используется вместе с локами. Польза от MVCC в том, что при чтении транзакция видит консистентный снепшот, при этом чтения не блокируют записи других транзакций. При записи все же используется лок.

dizza ★★★★★
(22.06.14 11:30:27 MSK)

Ссылка

Ответ на: комментарий от dizza 22.06.14 10:45:52 MSK

Конечно разные. Но на практике я не встречал другого: все изестные мне реляционки блокируют или строку или таблицу на апдейт не зависимо от уровня изоляции.

В общем оно так и от этого нельзя избавиться, но область и кол-во блокировок при разных операциях может существенно варьироваться. Некоторые СУБД не могут даже инсерты делать без полной блокировки таблицы, какие-то стараются делать минимально необходимое кол-во локов. Блокирующими (всегда) обычно считают первый подход, самый тупой.

Если нужна неблокирующая запись в радикальном понимании, то это решается только архитектурно, через логи в каком-либо виде и асинхронность применения апдейтов к состоянию, а не через выбор СУБД.

~~mashina~~ ★★★★★
(22.06.14 13:14:53 MSK)

Ответ на: комментарий от mashina 22.06.14 13:14:53 MSK

Угу, хотя я вот не очень понимаю почему нельзя лочить только столбцы, хотя бы. Известные мне реляционки лочат не меньше, чем строку.

Что касается неблокирующей записи, почему же, архитектура субд штука известная, можно и выбором базы решить.

dizza ★★★★★
(22.06.14 13:56:15 MSK)

Ответ на: комментарий от dizza 22.06.14 13:56:15 MSK

Угу, хотя я вот не очень понимаю почему нельзя лочить только столбцы, хотя бы. Известные мне реляционки лочат не меньше, чем строку.

В реляционках версионируется строка целиком и обычно хранится одним блобом если не рассматривать TOAST, из-за этого нельзя сделать лок только на столбец. А версионирование каждого столбца в строке отдельно даст большой оверхед по размеру и усложнит жизнь во всех остальных местах при доступе к данным в общем случае.

Можно делить таблицу на несколько по группам колонок и работать с ней через VIEW с JOINом на чтение + апдейты по отдельным таблицам. Будет умеренный гранулированный лок на группы столбцов.

~~mashina~~ ★★★★★
(22.06.14 14:57:51 MSK)

Ответ на: комментарий от mashina 22.06.14 14:57:51 MSK

Спасибо за разьяснение. Я так понимаю колоночные базы лишены такого недостатка?

dizza ★★★★★
(22.06.14 15:08:29 MSK)

Ответ на: комментарий от dizza 22.06.14 15:08:29 MSK

Спасибо за разьяснение. Я так понимаю колоночные базы лишены такого недостатка?

Группировка данных по колонкам это способ хранения данных на носителе для быстрого последовательного чтения колонок, этот подход не занимается проблемой локов в транзакциях. Но колоночные БД обычно вообще не имеют транзакций, не дают консистентные снимки базы и реализованны в виде записи в лог с последующим накатом на состояние.

Т.е. фактически да, недостатка такого у них нет, но не из-за того что его как решили, а в силу более топорной архитектуры и отказа от ACID в пользу менее строгих требований.

~~mashina~~ ★★★★★
(22.06.14 16:01:32 MSK)