Neo4J 2.2 — новая версия графовой базы данных

3

1

25 марта вышла новая версия графовой базы данных Neo4J.

В этом релизе представлены улучшения, которые, как утверждается, позволят существенно повысить производительность операций чтения и записи данных, а также улучшают возможности по отладке и тестированию.

Ключевые моменты изменений версии 2.2:

новый планировщик запросов для языка Cypher основанный на анализе затрат (cost-based optimizer);
поддержка профилирования и отладочного вывода для запросов Cypher;
новый механизм кеширования операций чтения, основанный на размещении страниц кеша в памяти (in-memory page cache);
новый механизм быстрой буферизации записи и оптимизация сброса транзакций на диск.

На начало 2015 года графовая база данных Neo4J занимает 23 место по популярности (по версии сайта DB-ENGINES).

>>> Подробности

Ссылка

← Выпущен свободный редактор Valentina 0.3.0 для создания выкроек одежды

Выпущен нотный редактор MuseScore 2.0 →

← 1 2 →

есть in-memory графовые базы, написанные на С?

cyanide_regime
(27.03.15 00:37:54 MSK)

На начало 2015 года графовая база данных Neo4J занимает 23 место по популярности

Это как дистровотч или тиобе?

bj ★
(27.03.15 00:39:12 MSK)

Ответ на: комментарий от bj 27.03.15 00:39:12 MSK

Определенно.

bookman900 ★★★★★
(27.03.15 00:41:39 MSK)

Ссылка

Ничего себе, оказывается сабж даже популярнее, чем MariaDB. Неожиданно.

slyjoeh ★★★★
(27.03.15 00:44:33 MSK)

Ответ на: комментарий от slyjoeh 27.03.15 00:44:33 MSK

Я думал sqlite будет тоже в топе (часто вижу его в мелких софтинах), а тут вон оно что.

alozovskoy ★★★★★
(27.03.15 00:48:48 MSK)

Ссылка

Ответ на: комментарий от slyjoeh 27.03.15 00:44:33 MSK

Неожиданно.

Вполне ожидаемо, mariadb-специфичных проблем в гугле ищут мало.

bj ★
(27.03.15 00:54:30 MSK)

Ссылка

Ответ на: комментарий от cyanide_regime 27.03.15 00:37:54 MSK

есть in-memory графовые базы, написанные на С?

вообще есть, например WhiteDB или VertexDB, но я ими честно не пользовался

PS можно еще посмотреть на Weaver, но это вроде совсем в сторону

shty ★★★★★
(27.03.15 01:27:53 MSK) автор топика

Ссылка

Ответ на: комментарий от bj 27.03.15 00:39:12 MSK

Это как дистровотч или тиобе?

все на самом деле еще немного хуже... :)

этот индекс вообще считается по упоминаниям в этих ваших энторнетах, так что это вполне себе индекс сферичности попугаев в гипотетическом ваккууме, но таки тренд отражает: говно, которым никто не пользуется обсуждается мало

shty ★★★★★
(27.03.15 01:33:11 MSK) автор топика

Ссылка

Ответ на: комментарий от slyjoeh 27.03.15 00:44:33 MSK

думаю для корректности рейтинга к MariaDB надо приплюсовать MySQL

shty ★★★★★
(27.03.15 01:43:41 MSK) автор топика

Механизм не новый, новое то, что кэш автотюнится. Раньше поддержка отображенных в память файлов (за счет чего кэширование) описывалась в конфиге наряду с типом кэша (тоже не самый легкий выбор), и вообще было только на люнипсе, а виндузятники страдали, а теперь все автотюнится и поддерживается на всех платформах. Годно!

anonymous
(27.03.15 01:57:42 MSK)

Ответ на: комментарий от anonymous 27.03.15 01:57:42 MSK

лучше OrientDB!

anonymous
(27.03.15 07:31:03 MSK)

Ответ на: комментарий от shty 27.03.15 01:43:41 MSK

а я думаю, что рейтинг объективен и ничего приплюсовывать не нужно

slyjoeh ★★★★
(27.03.15 10:10:02 MSK)

Не понимаю я, в чем профит от nosql. Имхо, в таблицах все логично.

Klymedy ★★★★★
(27.03.15 11:52:46 MSK)

Ответ на: комментарий от Klymedy 27.03.15 11:52:46 MSK

Графы в таблицах? Как ты себе это представляешь?

anonymous
(27.03.15 12:43:03 MSK)

Ответ на: комментарий от anonymous 27.03.15 01:57:42 MSK

пока не было времени в сорцы глядеть, но насколько я понял - таки все же механизм новый, раньше - да, был memory mapping, а теперь совсем in-memory сделали

shty ★★★★★
(27.03.15 13:15:19 MSK) автор топика

Ссылка

Ответ на: комментарий от slyjoeh 27.03.15 10:10:02 MSK

а я думаю, что рейтинг объективен и ничего приплюсовывать не нужно

дело не в объективности, а в погрешности, и в понимании рейтинг чего это

пока что MariaDB и MySQL не сильно разъехались и многие вещи прекрасно хиляют и там и там, так что про Maria в основном спрашивают специфичные для нее вещи, т.о. думаю реальное количество установок скорее всего больше, нежели следует из данного рейтинга

shty ★★★★★
(27.03.15 13:19:56 MSK) автор топика

Ссылка

Ответ на: комментарий от Klymedy 27.03.15 11:52:46 MSK

Не понимаю я, в чем профит от nosql. Имхо, в таблицах все логично.

а ты попробуй положить хотя бы 200Тб неструктурированных данных в таблицы и попробуй поработать с ними, потом посмотрим что ты скажешь ))

shty ★★★★★
(27.03.15 13:21:23 MSK) автор топика

Neo4j

Неофодж? Настоящая арийская БД?

mvas78
(27.03.15 13:42:56 MSK)

Ссылка

Ответ на: комментарий от anonymous 27.03.15 12:43:03 MSK

Данные в таблицах.

Klymedy ★★★★★
(27.03.15 15:20:56 MSK)

Ссылка

Ответ на: комментарий от shty 27.03.15 13:21:23 MSK

Ну так надо сразу данные записывать в таблицы структурированно. Если данные совсем не структурирование, то и nosql не сможет их обрабатывать.

Klymedy ★★★★★
(27.03.15 15:22:53 MSK)

Ответ на: комментарий от Klymedy 27.03.15 15:22:53 MSK

Если данные совсем не структурирование, то и nosql не сможет их обрабатывать.

а вот и нет, как раз отсутствие строго заданной схемы существенно меняет диспозицию в пользу nosql

если же данные совсем сильно разные - тут уже нужно строить какое-нибудь data lake, и опять nosql во все поля

shty ★★★★★
(27.03.15 15:47:43 MSK) автор топика

Ответ на: комментарий от Klymedy 27.03.15 15:22:53 MSK

кроме того обычно на таких объемах (по крайней мере в моих, не ручаюсь, что строго прямых, руках) традиционные базы начинают серьезно проседать по производительности

shty ★★★★★
(27.03.15 15:49:53 MSK) автор топика

Ответ на: комментарий от shty 27.03.15 15:47:43 MSK

Предположим, есть художественная литература, как пример совсем неструктурированных данных, содержащая описания персонажей. Как nosql может, к примеру, вывести средний возраст персонажей, имеющих 2 или 3 детей?

Klymedy ★★★★★
(27.03.15 15:52:30 MSK)

Ответ на: комментарий от shty 27.03.15 15:49:53 MSK

Вот с производительностью возможно, да. Хотя неужели нельзя просто оптимизировать хранение данных, оставив sql-интерфейс?

Klymedy ★★★★★
(27.03.15 15:53:53 MSK)

Ответ на: комментарий от Klymedy 27.03.15 15:52:30 MSK

Предположим, есть художественная литература, как пример совсем неструктурированных данных, содержащая описания персонажей. Как nosql может, к примеру, вывести средний возраст персонажей, имеющих 2 или 3 детей?

Вы часом не путаете проблему хранения неструктурированных данных и их обработки, не?

если что, можно поговорить и за обработку )

shty ★★★★★
(27.03.15 16:05:36 MSK) автор топика

Ответ на: комментарий от Klymedy 27.03.15 15:53:53 MSK

неужели нельзя просто оптимизировать хранение данных, оставив sql-интерфейс?

почему нельзя, можно - SQL же декларативный язык

кстати, к примеру, упоминавшаяся в треде OrientDB вполне себе поддерживает SQL как язык запросов

и если посмотреть на CQL (Cassandra), то можно заметить, что он вообще-то практически один в один тот самый SQL

shty ★★★★★
(27.03.15 16:12:23 MSK) автор топика
Последнее исправление: shty 27.03.15 16:13:25 MSK (всего исправлений: 2)

Ссылка

Ответ на: комментарий от shty 27.03.15 16:05:36 MSK

и попробуй поработать с ними

Я имел в виду именно обработку, а хранить можно блобом.

Klymedy ★★★★★
(27.03.15 16:30:46 MSK)

Ответ на: комментарий от Klymedy 27.03.15 16:30:46 MSK

все же базы данных - это про хранение, а то так мы сейчас до аналитических систем докатимся )

а про «поработать» имелось в виду запись/чтение, индексирование, масштабирование и т.п.

shty ★★★★★
(27.03.15 16:41:37 MSK) автор топика

Ответ на: комментарий от shty 27.03.15 16:41:37 MSK

Базы могут делать обработку данных. Хранить неструктурированные данные можно в блобах. А докатимся мы до 5.4.

Klymedy ★★★★★
(27.03.15 16:49:14 MSK)

Ответ на: комментарий от Klymedy 27.03.15 16:49:14 MSK

Базы могут делать обработку данных.

например?

Хранить неструктурированные данные можно в блобах.

можно, но нафига тогда реляционную базу брать?

shty ★★★★★
(27.03.15 16:52:14 MSK) автор топика

Ответ на: комментарий от Klymedy 27.03.15 15:53:53 MSK

NoSQL подразумевает не только и не столько отказ от SQL как языка запросов. Терминологическая путаница.
Возможно наименее плохим определением nosql СУБД будет что то вроде: «СУБД сознательно отказавшаяся от соблюдения одного или нескольких требований предъявляемых реляционным СУБД (с.м. 12 правил Кодда[1]) ради получения некоторых выгод».

[1] https://ru.wikipedia.org/wiki/12_правил_Кодда

MrClon ★★★★★
(27.03.15 17:04:29 MSK)

Вопрос чайника: В чем популярность графовой базы данных Neo4j ? Графовая модель дает скорость ? Но тогда должна быть реализация на C - скорость будет больше.

Oaks
(27.03.15 17:13:47 MSK)

Ответ на: комментарий от shty 27.03.15 16:52:14 MSK

например?

UPDATE persons SET street = 'Nissestien 67', city = 'Sandnes' WHERE lastname = 'Tjessem' AND firstname = 'Jakob';

Разве это не обработка?

нафига тогда реляционную базу брать?

Нафига связываться с неструктурированными данными? И что nosql может такого с ними делать, чего не могут обычные?

Klymedy ★★★★★
(27.03.15 17:34:22 MSK)

Ответ на: комментарий от MrClon 27.03.15 17:04:29 MSK

Даже Mysql не соблюдает правила Кодда.

Klymedy ★★★★★
(27.03.15 17:40:40 MSK)

у меня сразу ассоциация с бтрфс
как в этой базе обстоят дела со снэпшотами ?

kto_tama ★★★★★
(27.03.15 17:46:24 MSK)

Ссылка

Ответ на: комментарий от Oaks 27.03.15 17:13:47 MSK

Лучше OrientDB. Я тебе гооворю. Там и графовый движок есть, да!

anonymous
(27.03.15 17:47:50 MSK)

Ссылка

Ответ на: комментарий от Oaks 27.03.15 17:13:47 MSK

В чем популярность графовой базы данных Neo4j ?

хорошо сделана, нормальная документация

Графовая модель дает скорость ?

графовая модель хорошо подходит для моделирования отношений, например граф друзей или предпочтения пользователей

Но тогда должна быть реализация на C - скорость будет больше.

Java дает сравнимую скорость, и ее правильно готовить легче и быстрее

shty ★★★★★
(27.03.15 17:48:17 MSK) автор топика

Ссылка

Ответ на: комментарий от Klymedy 27.03.15 17:34:22 MSK

UPDATE persons SET street = 'Nissestien 67', city = 'Sandnes' WHERE lastname = 'Tjessem' AND firstname = 'Jakob';
Разве это не обработка?

вообще нет, это то что называется CRUD

в принципе это вопрос терминологический, но лучше не запутывать себя с самого начала

и у меня вопрос, как Вы такие запросы к блобу собираетесь строить?

shty ★★★★★
(27.03.15 17:53:49 MSK) автор топика

Ссылка

Ответ на: комментарий от Klymedy 27.03.15 17:34:22 MSK

Нафига связываться с неструктурированными данными?

потому что данные в реальном мире не обязаны быть структурированными и, как правило, таковыми не являются

И что nosql может такого с ними делать, чего не могут обычные?

да тот же CRUD умеют делать, только с учетом несколько других задач и окружения

Важный момент! Я не топлю здесь за отказ от реляционных баз, надо лишь понимать их ограничения и использовать строго тогда когда надо.

shty ★★★★★
(27.03.15 18:03:39 MSK) автор топика

Ответ на: комментарий от shty 27.03.15 18:03:39 MSK

Можете привести пример таких неструктурированых данных?

Klymedy ★★★★★
(27.03.15 18:10:01 MSK)

Ответ на: комментарий от Klymedy 27.03.15 17:40:40 MSK

Так вот почему он такой популярный, это ведь оказывается не унылый SQL, а модный хипсторский noSQL!

А если серьёзно я не просто так добавил оговорку про «сознательный отказ». Предполагается что мускуль пытается быть труЪ РСУБД, но не всегда осиливает.

P.S. ссылка намекает на не соблюдение восьмого правила, «физическая независимость данных»? Думаю подразумеваются уровень штатных интерфейсов приложения, а не уровень хранения данных.

MrClon ★★★★★
(27.03.15 18:17:33 MSK)

Ссылка

Ответ на: комментарий от Klymedy 27.03.15 18:10:01 MSK

Можете привести пример таких неструктурированых данных?

множество всех веб-ресурсов, медицинские данные, научные данные, данные о работе предприятия, на самом деле совокупность данных почти любой предметной области - неструктурирована

shty ★★★★★
(27.03.15 18:22:52 MSK) автор топика

Ответ на: комментарий от Oaks 27.03.15 17:13:47 MSK

Графовая модель дает скорость ?

Скорее наоборот. Хотя некоторые графы наверное очень хорошо партиционируются, что может быть полезно при выдрочке скорости.
Граф даёт удобство. В некоторых случаях.

MrClon ★★★★★
(27.03.15 18:26:50 MSK)

Ответ на: комментарий от shty 27.03.15 18:22:52 MSK

Множество веб-ресурсов использует реляционные БД, и данные там структурированы.

Klymedy ★★★★★
(27.03.15 18:29:25 MSK)

Ответ на: комментарий от Klymedy 27.03.15 18:29:25 MSK

Множество веб-ресурсов использует реляционные БД, и данные там структурированы.

1) 4.2 номер 1: про реляционные данные - это не так, Google, Amazon, Yahoo, (+100500 тысяч их, и все веб-ресурсы) используют нереляционные базы данных (возможно наряду с реляционными, и тем веселее)

2) 4.2 номер 2: Вы и правда считаете что домашняя страничка Васи Пупкина согласована с тем что сделано внутри Facebook (например) и одновременно с сообщениями Марьи Петровны на форуме садоводов? да Вы оптимист отчаянный

shty ★★★★★
(27.03.15 18:41:53 MSK) автор топика
Последнее исправление: shty 27.03.15 18:43:40 MSK (всего исправлений: 2)

Ответ на: комментарий от MrClon 27.03.15 18:26:50 MSK

Я скажу, как член команды, которая юзает непосредственно neo4j в проекте. У нас древовидная структура, сущности тесно связаны и часто достаются по длинным цепочкам (типа как путь к папке). Тут оно достаточно тормозное, ибо путь может быть длинным, и беготня по двадцати связанным нодам может влететь в копеечку с учетом того веера ребер, которые от них расходятся (а тебе нужно выбрать на каждом шаге какое-то одно). Это, конечно, лучше, чем ~~дрочка вприсядку~~ моделирования иерархических СД на SQL (да, да, давайте сюда с вашими nested sets или 100кратными джойнами таблицы с самой собой).

Но когда нужно по коротким цепочкам каких-то паттернов ходить, либо просто найти цепочку между несколькими сущностями - тут ваще огонь.

Ну и плюс индексы и модель с метками (индексы наметках значительно помогают).

В общем, я за то, чтобы кричать ненужно только по делу, а не потому, что тебе пока не пригодилось (это я не тебе, а вообще всем).

anonymous
(28.03.15 02:15:57 MSK)

Ответ на: комментарий от Klymedy 27.03.15 15:22:53 MSK

Ты как граф в таблицу положишь, сладенький? А если у тебя там циклы ещё есть, то твой маршаллер вообще самоубьется.

cherry-pick
(28.03.15 10:17:25 MSK)

Ссылка

Ответ на: комментарий от anonymous 28.03.15 02:15:57 MSK

Анон, ты часом не в курсе как там унутре сделано хранение и обработка графов?
Часто говоря о графовых СУБД говорят только об удобстве интерфейса, а вот о поездатых алгоритмах для эффективной работы с графовыми данными слышать как-то не приходилось.
Возникают опасения что внутре у ей ~~неонка~~ какая-то кандовость вроде той-же РСУБД (или какой-нибудь монги) с таблицами вершин и рёбер, а СУБД представляем тобой просто удобный интерфейс.
Подчеркну — это вопрос, а не утверждение.

MrClon ★★★★★
(28.03.15 13:53:35 MSK)

Ответ на: комментарий от shty 27.03.15 18:41:53 MSK

Существование хороших, годных историй успеха с nosql СУБД не умаляет достоинств РСУБД, в частности не умоляет их годность в качестве варианта по умолчанию.
Так-же наличие таких саксес стори не оправдывает влажных восторгов хипсетров норовящих пропихнуть новомодную штучку куда попало.

С другой стороны достоинства РСУБД и тупость тупых хипстеров не переводят все nosql СУБД в разряд ненужных ненужностей не имеющих права на существование и не оправдывают снобистское отрицание того факта что в некоторых случаях использование nosql СУБД является разумным инженерным решением.

MrClon ★★★★★
(28.03.15 14:04:15 MSK)

Ссылка

Ответ на: комментарий от MrClon 28.03.15 13:53:35 MSK

Не, там не таблицы, эффективный бинарный формат со своим хранилищем для каждого типа сущностей (ноды отдельно, отношения отдельно и т.д.). Можешь скачать с их сайта архивчик и запустить, а потом глянуть в папке, куда оно складывается - файлы со словом store

anonymous
(28.03.15 14:52:09 MSK)