Redis 3.0.0

2

1

1-го апреля 2015 года стала доступна новая версия нереляционной СУБД Redis. Основной отличительной особенностью данного релиза является то, что это первая стабильная версия Redis со встроенной поддержкой кластеризации*).

Redis - это нереляционная СУБД типа ключ-значение (key-value) с открытым исходным кодом.

Поддерживает следующие структуры данных:

строка (string);
хэш (hash);
список (list);
множество (set);
сортированное множество (sorted set);
битовый массив (bitmap);
HyperLogLog (структура данных для реализации алгоритма рандомизированного вероятностного подсчета количества уникальных значений).

Для всех этих типов поддерживаются атомарные операции (например вставка в список или пересечение множеств). База данных Redis хранится в основной памяти, а для обеспечения долговременного хранения используется синхронизация на диск.

Основные изменения:

встроенная поддержка кластеризации;
улучшен аппроксимационный алгоритм вытеснения ключей для LRU**)-кешей;
добавлена команда CLIENT PAUSE: остановка обработки всех запросов клиента на определенное время;
переработан механизм обеспечения долговременного хранения даных AOF***) с целью уменьшения задержек при сбросе буфера на медленных дисках;

*) Redis Cluster Specification
**) least recently used
***) append only file

>>> Подробности

Ссылка

← Закончился аудит TrueCrypt

Увидел свет Django 1.8 →

← 1 2 →

Ответ на: комментарий от shty 03.04.15 15:41:23 MSK

так тебе не нужен redis, тебе нужно освоить bulk data loading

Задача такая. Файлы обрабатываются по одному и перед вставкой проверяется на его наличие в базе. Если я буду сначала кэшировать, а потом вставлять, то мне все эти проверки придется делать вручную, в кэше, перед bulk load.

Пишу клиента к оффлайновому архиву книг. Дано: 120Гб архивов по 1000 файлов fb2 в каждом. Цель(уже достигнута, но для SQlite и MySql): Распарсить каждый fb2 и загнать метаинформацию в БД. В принципе я добился приемлемой скорости с помощью многопоточной обработки, но хотелось бы попробовать ускорить еще раз в 10-100. Есть идея что Redis в этом может помочь.

Loki13 ★★★★★
(03.04.15 15:58:20 MSK)

Ответ на: комментарий от Loki13 03.04.15 15:58:20 MSK

in-memory sqlite?

makoven ★★★★★
(03.04.15 16:07:39 MSK)

Ссылка

Ответ на: комментарий от Loki13 03.04.15 15:58:20 MSK

Задача такая. Файлы обрабатываются по одному и перед вставкой проверяется на его наличие в базе. Если я буду сначала кэшировать, а потом вставлять, то мне все эти проверки придется делать вручную, в кэше, перед bulk load.

все правильно, и именно так будет весьма быстрее :)

Цель(уже достигнута, но для SQlite и MySql): Распарсить каждый fb2 и загнать метаинформацию в БД.

это не цель, это задача, а цель какая? а то может быть взять ElasticSearch и не ломать голову?

120Гб архивов
Есть идея что Redis [..] может помочь.

есть мнение, что поскольку Redis in-memory решение, то Вам хорошо бы иметь систему хотя бы с 64Гб памяти (зависит, конечно, от того как будет использоваться), а иначе особого выигрыша Вы не добьетесь, а только сами себе тянитолкая соорудите

shty ★★★★★
(03.04.15 16:19:42 MSK) автор топика

Ответ на: комментарий от Loki13 03.04.15 15:58:20 MSK

Есть идея что Redis в этом может помочь.

bdb, leveldb и любые другие встраиваемые KV помогут сильнее.

bj ★
(03.04.15 16:24:58 MSK)

Ответ на: комментарий от shty 03.04.15 16:19:42 MSK

это не цель, это задача, а цель какая?

Цель проект дописать и выложить на гитхаб. Уже на 2 месяца от сроков(своих внутренних) затянул, т.к. всё время что-нибудь улучшить хочется.

есть мнение, что поскольку Redis in-memory решение, то Вам хорошо бы иметь систему хотя бы с 64Гб памяти

120Гб это все книги столько занимают. метаинформации(автор, название, издательство, серия) в них максимум 0,1%.

Loki13 ★★★★★
(03.04.15 16:35:09 MSK)
Последнее исправление: Loki13 03.04.15 16:37:06 MSK (всего исправлений: 1)

Ответ на: комментарий от bj 03.04.15 16:24:58 MSK

bdb, leveldb и любые другие встраиваемые KV помогут сильнее.

спасибо. почитаю.

Loki13 ★★★★★
(03.04.15 16:36:36 MSK)

Ссылка

нравится редис но хочется хранить данных больше чем памяти. хочется logstash-и натравить на редисы, но чтобы отдельновзятые list-ы, которые реализуют очереди, сбрасывались на хранились диск, не подгружались в память при рестарте.
есть чо такое?

bl ★★★
(03.04.15 16:55:00 MSK)

Ссылка

Зачем скобки после звёздочек?

anonymous
(03.04.15 17:41:52 MSK)

Ответ на: комментарий от anonymous 03.04.15 17:41:52 MSK

это коммунальные службы снег убирают

shty ★★★★★
(03.04.15 17:51:04 MSK) автор топика

Ссылка

Так чем оно лучше rethinkdb?

loz ★★★★★
(03.04.15 18:39:26 MSK)

Кластеризация на основе хэшей ключей ? С master-slave или master-master ( с полной дубликацией данных ) все по прежнему пичально ? ( переключение вручную ?)

~~Jopich~~
(03.04.15 18:55:15 MSK)

Ссылка

Ответ на: комментарий от Loki13 03.04.15 15:58:20 MSK

Если документы - то тогда уж лучше монгу использовать, а redis - он больше «ключ-значение» БД

~~Jopich~~
(03.04.15 18:57:04 MSK)

Ответ на: комментарий от Jopich 03.04.15 18:57:04 MSK

Какой профит монги по сравнению с sql в данной задаче?

makoven ★★★★★
(03.04.15 19:07:11 MSK)

Ответ на: комментарий от Loki13 03.04.15 16:35:09 MSK

120Гб это все книги столько занимают. метаинформации(автор, название, издательство, серия) в них максимум 0,1%.

тогда Вам не нужен NoSQL

shty ★★★★★
(03.04.15 19:12:15 MSK) автор топика

Ответ на: комментарий от shty 03.04.15 19:12:15 MSK

тогда Вам не нужен NoSQL

Т.е. мне NoSql БД не позволит делать запись быстрее(чем MySql) при количестве записей 450к и в 10 потоков. Если нет, то тогда и смысла нет. Хотя должен бы по всем описаниям.

Loki13 ★★★★★
(03.04.15 19:19:14 MSK)

Ответ на: комментарий от Loki13 03.04.15 19:19:14 MSK

Т.е. мне NoSql БД не позволит делать запись быстрее(чем MySql) при количестве записей 450к и в 10 потоков.

дело не в этом, дело в том, что это Вам не нужно :)

нужно проиндексировать метаинформацию в умеренных объемах - берите Lucene, эмбеддите его, стройте индекс, и все будет летать и искаться как надо

shty ★★★★★
(03.04.15 19:36:35 MSK) автор топика

Ссылка

Ответ на: комментарий от fero 02.04.15 23:07:41 MSK

Алсо, как правильно произносить?

Ри-дайс.

anonymous
(03.04.15 19:58:30 MSK)

Ссылка

Хорошее время для релиза, 1 апреля

spec_po_kiskam ★★★
(03.04.15 21:21:07 MSK)

Ссылка

Ответ на: комментарий от Pyzia 02.04.15 22:59:27 MSK

База данных Redis хранится в основной памяти

Довольно странное название для оперативной памяти, может стоит поправить, дабы не вводить несведущих в заблуждение?

Нормальное название, для тех, кто помнит типы памяти ДОСа. Действительно, не в EMS же и XMS хранить базу данных если ей хватает остатка от 640 Кб. Это какая экономичность и скорость должна быть у редиски!

~~Napilnik~~ ★★★★★
(03.04.15 21:46:31 MSK)

Ссылка

Ответ на: комментарий от loz 03.04.15 18:39:26 MSK

Так чем оно лучше rethinkdb?

Чем грузины. Из критериев для сравнения подойдет только скорость, твоя поделка начинает тормозить даже на смешном датасете. Это как сравнивать яблоки и говно.

bj ★
(03.04.15 22:00:38 MSK)