Вторая волна разработки Java-приложений: Базы данных типа NoSQL

0

3

Системы управления базами данных, не использующие SQL (или NoSQL-СУБД), постепенно выходят на первый план в эру Web 2.0, поскольку они эффективно решают проблемы масштабируемости. Несмотря на то, что эти СУБД еще находятся на заре своей популярности, они уже используются такими крупными компаниями, как Google и Facebook. Базы данных, не имеющие схем, кардинально отличаются от традиционных реляционных БД, однако работа с ними на практике оказывается проще, чем кажется, особенно если проектирование начинать с разработки модели предметной области, а не реляционной схемы.

>>> Подробности

Ссылка

← Вышел PCC 1.0

Секция СПО на Сибирском Форуме «Индустрия Информационных систем» →

← 1 2 3 →

Тем временем...

Database models and alternatives settle back on SQL: http://blog.xeround.com/2011/01/five-predictions-for-your-database-in-2011

SunSunich ★
(08.04.11 22:12:37 MSK)

> Системы управления базами данных, не использующие SQL (или NoSQL-СУБД), постепенно выходят на первый план

Ага!

ни уже используются такими крупными компаниями, как Google и Facebook

Ага! Но причем сдесь Java?))) Хотя может я че упустил, просветите.

anonymous
(08.04.11 22:50:05 MSK)

IBM_DW, если ты сейчас не ответишь на мое сообщение уже окончательно буду тебя считать ботом!

~~SebastianPoeiro~~
(08.04.11 23:21:18 MSK)

Ответ на: Тем временем... от SunSunich 08.04.11 22:12:37 MSK

>Database models and alternatives settle back on SQL

обратно возвращаются к SQL?

anonymous
(08.04.11 23:44:48 MSK)

Ссылка

Ага, ага. Есть хоть одна production-ready nosql база без копилефта? С копилефтом - BerkleyDB, а без - хрен.

Надо в один закрытый проект, а платить 5К ойро за лицензию на BDB жаба давит.

Dark_SavanT ★★★★★
(08.04.11 23:51:13 MSK)

Ответ на: комментарий от anonymous 08.04.11 22:50:05 MSK

Ну как бы это статья IBM и она так называется. И хотя КО, призадумался, но можно догадаться, что базы данных больше всего интересуют ентерпрайз, а энтерпрайз на 99% состоит из java :) логика вполне очевидна.

Конечно есть веб-сервера интернета. Но они слишком сильно подсели на php+mysql и слезть практически не реально. Представьте себе портирование joomla, и всех прочих cms на NoSQL? Да кому это счастье надо, такой ценой? Поэтому NoSQL пока интересуются только энтерпрайзы. А там правит балом java.

vladoos
(08.04.11 23:55:16 MSK)

Ответ на: комментарий от vladoos 08.04.11 23:55:16 MSK

> Ага! Но причем сдесь Java?)))

Я так и не понял ты ответил на вопрос в месаге которую коментируешь?

anonymous
(08.04.11 23:59:04 MSK)

Ссылка

Ответ на: комментарий от Dark_SavanT 08.04.11 23:51:13 MSK

> Надо в один закрытый проект, а платить 5К ойро за лицензию на BDB жаба давит.

Какие требования?

deis ★
(09.04.11 00:05:15 MSK)

Ответ на: комментарий от deis 09.04.11 00:05:15 MSK

Надёжность, встраиваемость, многопоточность. Нужно уметь хранить вагон KVP, быстро искать по ним, писать редко.

Dark_SavanT ★★★★★
(09.04.11 00:09:15 MSK)

Ответ на: комментарий от Dark_SavanT 08.04.11 23:51:13 MSK

> Ага, ага. Есть хоть одна production-ready nosql база без копилефта? С копилефтом - BerkleyDB, а без - хрен.

Надо в один закрытый проект, а платить 5К ойро за лицензию на BDB жаба давит.

А паланкин и четыре раба к нему нахаляву не желаете? :)

~~rtvd~~ ★★★★★
(09.04.11 00:14:26 MSK)

Ответ на: комментарий от rtvd 09.04.11 00:14:26 MSK

Паланкин не надо, а вот четвёрку рабов-кодеров пожалуй возьму.

Dark_SavanT ★★★★★
(09.04.11 00:22:00 MSK)

Ссылка

Ответ на: комментарий от SebastianPoeiro 08.04.11 23:21:18 MSK

Скорее всего, бот и есть )

LongLiveUbuntu ★★★★★
(09.04.11 00:22:23 MSK)

Ответ на: комментарий от LongLiveUbuntu 09.04.11 00:22:23 MSK

IBM_dw - это бот. Об этом известно всем.

Dark_SavanT ★★★★★
(09.04.11 00:34:10 MSK)

Ответ на: комментарий от Dark_SavanT 09.04.11 00:09:15 MSK

Есть где-нибудь на посмотреть более подробные требования, в частности, по интерфейсу. Как вообще предполагается взаимодействие - в виде внешней библиотеки или за счёт включения в исходный код?

deis ★
(09.04.11 00:34:23 MSK)

Ответ на: комментарий от Dark_SavanT 09.04.11 00:34:10 MSK

Видимо, не всем ))

LongLiveUbuntu ★★★★★
(09.04.11 00:39:17 MSK)

Ответ на: комментарий от deis 09.04.11 00:34:23 MSK

посмотреть только через libastral.so из git-ng репы.

Если серьёзно - динамическая линковка библиотеки к приложению(клиент-сервер нежелателен), интерфейсы к чему-нибудь из .net(mono)/java/C и хранение key-value pair возможно с неуникальным ключом.

SQLite - не нравится только наличием sql. Для моей задачи SQL - несколько overkill.

Dark_SavanT ★★★★★
(09.04.11 00:46:19 MSK)

Ответ на: комментарий от LongLiveUbuntu 09.04.11 00:39:17 MSK

За пару месяцев на ЛОРе можно понять о сути IBM_dw

Dark_SavanT ★★★★★
(09.04.11 00:47:50 MSK)

Ссылка

Ответ на: комментарий от Dark_SavanT 09.04.11 00:34:10 MSK

http://www.linux.org.ru/jump-message.jsp?msgid=1746540&cid=1746684

~~snoopcat~~ ★★★★★
(09.04.11 00:49:13 MSK)

Ответ на: комментарий от snoopcat 09.04.11 00:49:13 MSK

http://www.linux.org.ru/show-comments.jsp?nick=IBM_dW

Три комментария за 4 года, причём только в 2007 году.

Dark_SavanT ★★★★★
(09.04.11 00:51:40 MSK)

Ответ на: комментарий от Dark_SavanT 09.04.11 00:51:40 MSK

да я видел :D

~~snoopcat~~ ★★★★★
(09.04.11 01:05:48 MSK)

Ссылка

Но зачем?

~~AVL2~~ ★★★★★
(09.04.11 01:44:47 MSK)

«Эндрю Гловер является президентом компании Stelligent Incorporated , ...Просмотрите блог Энди , там можно найти список его публикаций.»

Показательно что блог у «успешного» президента компании, мало того что лежит, так еще и вываливает весь error_reporting в stdout.

mrdeath ★★★★★
(09.04.11 02:34:06 MSK)

Ссылка

mongodb - http://www.mongodb.org/display/DOCS/Benchmarks

anonymous
(09.04.11 04:25:38 MSK)

Ссылка

Ответ на: комментарий от Dark_SavanT 09.04.11 00:34:10 MSK

>IBM_dw - это бот. Об этом известно всем.

Это Оля

yoghurt ★★★★★
(09.04.11 07:47:09 MSK)

Ответ на: комментарий от AVL2 09.04.11 01:44:47 MSK

Но зачем?

Затем, что одно подменяется другим, более простым в случае с OR-mapping — более эффективным и быстрым.

Вся бизнес-логика сосредоточена в бинах (Plain Old Java Object — POJO) и ссылочных отношениях между активными объектами. Сложные SQL запросы с оптимизацией выборки в этом случае не нужны, так как используются в основном OR-mapping механизмы связанные с прямым отображением состояния активных объектов на строки в БД (персистентность состояния объектов обеспечивается записями в БД). Кэш данных и так в виде активных объектов в памяти, дополнительно что-то кэшировать не нужно. Методы, которые сложнее get/set, сильнее оптимизируются JIT, чем оптимизатором традиционной СУБД. Оверхед на один объект (одну «запись», или строку) в Java примерно 80 байт. Для SQL-ориентированных СУБД с учётом парсера и механизма предварительной подготовки запросов вряд ли сильно меньше.

iZEN ★★★★★
(09.04.11 08:41:22 MSK)

>Системы управления базами данных, не использующие SQL (или NoSQL-СУБД) Вообще-то они вполне могут использовать SQL. NoSQL - Not Only SQL. В глаза бросилось

IvS ★
(09.04.11 10:34:33 MSK)

Ответ на: комментарий от Dark_SavanT 09.04.11 00:46:19 MSK

> Если серьёзно - динамическая линковка библиотеки к приложению(клиент-сервер нежелателен), интерфейсы к чему-нибудь из .net(mono)/java/C и хранение key-value pair возможно с неуникальным ключом.

Понятно

SQLite - не нравится только наличием sql. Для моей задачи SQL - несколько overkill.

Какой-нибудь специфический функционал, помимо стандартных поиска, вставки и удаления?

deis ★
(09.04.11 10:57:22 MSK)

Статья - очередная ИБМовская параша про свои узколобые технологии. У меня ИБМ даже висит в блэклисте.

matumba ★★★★★
(09.04.11 12:04:08 MSK)

Ссылка

Ответ на: комментарий от yoghurt 09.04.11 07:47:09 MSK

>>IBM_dw - это бот. Об этом известно всем.

Это Оля

до февраля 2007 года наверное Оля :-) было 3 комментария.

теперь, похоже, бот.

:-)

samy_volosaty ★★★★★
(09.04.11 12:04:08 MSK)

Ответ на: комментарий от samy_volosaty 09.04.11 12:04:08 MSK

Оля перешла в цифровое измерение! «Газонокосильщик» рулит. :)

matumba ★★★★★
(09.04.11 12:05:02 MSK)

Ссылка

Ответ на: комментарий от IvS 09.04.11 10:34:33 MSK

> NoSQL - Not Only SQL

Если это аббревиатура, то почему «O» маленькая? :)

Apple-ch ★★
(09.04.11 13:03:32 MSK)

Ответ на: комментарий от deis 09.04.11 10:57:22 MSK

> Какой-нибудь специфический функционал, помимо стандартных поиска, вставки и удаления?

Пока не предполагается. Сложных выборок данных тоже не предполагается. Упор на чтение, предполагается что запись или удаление происходят гораздо реже.

Dark_SavanT ★★★★★
(09.04.11 13:04:34 MSK)

Ответ на: комментарий от Apple-ch 09.04.11 13:03:32 MSK

Traditionally...

Dark_SavanT ★★★★★
(09.04.11 13:04:53 MSK)

Ссылка

Ответ на: комментарий от iZEN 09.04.11 08:41:22 MSK

Как то ты непонятно выразился

~~vertexua~~ ★★★★★
(09.04.11 13:05:21 MSK)

Ответ на: комментарий от vladoos 08.04.11 23:55:16 MSK

а ACID в ынтерпрайзе не нужэн, да?

anonymous
(09.04.11 13:14:50 MSK)

Ответ на: комментарий от Dark_SavanT 09.04.11 13:04:34 MSK

> Пока не предполагается. Сложных выборок данных тоже не предполагается. Упор на чтение, предполагается что запись или удаление происходят гораздо реже.

То есть, по-минимуму, должно быть три функции (по факту, шесть - три на собственно значение, и три в обратную сторону), смотрящих наружу - чтение заданного значения, его запись (замена) и удаление?

deis ★
(09.04.11 13:17:42 MSK)

Ответ на: комментарий от deis 09.04.11 13:17:42 MSK

Ещё поиск по ключу и курсор на таблицу.

Dark_SavanT ★★★★★
(09.04.11 13:41:16 MSK)

Ответ на: комментарий от anonymous 08.04.11 22:50:05 MSK

> > ни уже используются такими крупными компаниями, как Google и Facebook

Ага! Но причем сдесь Java?))) Хотя может я че упустил, просветите.

Facebook использует проекты Apache: Hadoop, HBase, Cassandra написанные на Java.

Этот стек на данный момент является самым распространённым в крупных компаниях долины. Так же есть решения на C++ & Erlang. Но они либо внутренние(Google BigTable, Amazon Dynamo) либо менее популярные(MongoDB, CouchDB, Riak) и чаще используются в стартапах или хакерами.

anonymous
(09.04.11 13:46:01 MSK)

Ссылка

Ответ на: комментарий от Dark_SavanT 09.04.11 13:41:16 MSK

> Ещё поиск по ключу и курсор на таблицу.

Под чтением я и имел в виду поиск - значение по ключу и ключ по значению. Каким образом изначально предполагается определять ключ?

deis ★
(09.04.11 14:15:35 MSK)

Ответ на: комментарий от deis 09.04.11 13:17:42 MSK

Тут кое-что нашлось - http://stackoverflow.com/questions/260804/alternative-to-berkeleydb

в частности Kyoto Cabinet. Насколько я понял из сайта, идёт под GPL/LGPL license. LGPL меня устраивает.

Dark_SavanT ★★★★★
(09.04.11 14:21:40 MSK)

Ссылка

Статья о сепульках и о том как их правильно разводить.

anonymous
(09.04.11 14:27:36 MSK)

Ссылка

Ответ на: комментарий от deis 09.04.11 14:15:35 MSK

ключ - хэш от уникальной строки(aka серийник например). По ключу может быть одна или несколько записей(насчёт нескольких пока ещё стоит вопрос «а нужно ли»). Значение - структура с n ValueType полями, с которыми идёт работа. Меняться эта структура будет редко.

Т.о. по факту нужна одна большая KVP таблица и несколько вспомогательных, к которым никаких особых требований не предьявляется.

Можно сделать и на SQL, но слишком уж большой предположительный оверхед в коде получается.

Dark_SavanT ★★★★★
(09.04.11 14:30:41 MSK)

Ответ на: комментарий от Dark_SavanT 09.04.11 14:30:41 MSK

> ключ - хэш от уникальной строки(aka серийник например). По ключу может быть одна или несколько записей(насчёт нескольких пока ещё стоит вопрос «а нужно ли»).

Это понятно, я немного про другое - откуда программа берёт собственно ключ при работе. Он определяется на основании каких-то внешних событий (например, через сканер штрих кода)?

deis ★
(09.04.11 14:40:26 MSK)

Ответ на: комментарий от Dark_SavanT 09.04.11 13:04:34 MSK

>Упор на чтение, предполагается что запись или удаление происходят гораздо реже.

Ок, клёво, а чем тогда какой-нибудь directory server - не NoSQL? LDAP как раз и рассчитан на несложные выборки данных с минимумом записи и максимум производительности на чтение.

DRVTiny ★★★★★
(09.04.11 14:49:44 MSK)

Ответ на: комментарий от DRVTiny 09.04.11 14:49:44 MSK

> Ок, клёво, а чем тогда какой-нибудь directory server - не NoSQL? LDAP как раз и рассчитан на несложные выборки данных с минимумом записи и максимум производительности на чтение.

Из таблицы в несколько сотен миллионов строк?

deis ★
(09.04.11 14:53:07 MSK)

Ответ на: комментарий от deis 09.04.11 14:53:07 MSK

В LDAP нет таблиц, учите матчасть. Бэкендом могут быть базы данных с таблицами, но это уже никого не волнует.
И таки да, в каталогах может быть сколько угодно записей, если, конечно, вы не полагаете наивно, что нет каталога, кроме AD и Microsoft пророк его.

DRVTiny ★★★★★
(09.04.11 15:06:40 MSK)

Ответ на: комментарий от DRVTiny 09.04.11 15:06:40 MSK

> В LDAP нет таблиц, учите матчасть. Бэкендом могут быть базы данных с таблицами, но это уже никого не волнует.

Ну да, особенно если учесть, что сам LDAP - это протокол

deis ★
(09.04.11 15:10:15 MSK)

Ответ на: комментарий от deis 09.04.11 14:53:07 MSK

>Из таблицы в несколько сотен миллионов строк?

Кстати, насчёт количества... А вы много видели реальных приложений, которые хотя бы иногда вообще чистят базы от outdated или просто ненужной информации? Я уж не говорю о том, что и базы данных (по крайней мере те, что SQL), в которых среди полей таблиц не встретишь откровенной ахинеи, либо элементарно вычисляемой по другим полям, либо вообще нигде не использующейся - тоже крайне мало. Думаю, не ошибусь, если скажу, что все эти хвалёные промышленные СУБД процентов на 80 ворочают мусором и оптимизируются так сильно прежде всего для того, чтобы эти 80% не мешали оперировать оставшимися 20-ю.

DRVTiny ★★★★★
(09.04.11 15:12:57 MSK)

Ответ на: комментарий от deis 09.04.11 15:10:15 MSK

Хорошо, в иерархических СУБД, основанных на этом самом протоколе. SQL - это тоже протокол, потому что протокол - это стандартизованный язык обмена управляющей информацией и данными.

DRVTiny ★★★★★
(09.04.11 15:16:07 MSK)

Ответ на: комментарий от DRVTiny 09.04.11 15:12:57 MSK

> А вы много видели реальных приложений, которые хотя бы иногда вообще чистят базы от outdated или просто ненужной информации?

Если речь не идёт об удалённых записях, то это, вообще говоря, не приложению решать. Удалённые записи на скорость доступа к данным с точки зрения алгоритма не влияют - естественно, при грамотной организации такого доступа

deis ★
(09.04.11 15:26:44 MSK)