LINUX.ORG.RU

Вышла новая версия SciDB

 


4

6

Вышла новая версия проекта SciDB - 12.12.

SciDB - проект Майка Стоунбрейкера, отца многих СУБД.

SciDB - версионируемая СУБД для аналитики, работающая с большими многомерными распределёнными массивами.

Доступны два вида синтаксиса:

  • Array Query Language (AQL) — язык очень похожий на SQL, но работающий не с таблицами (таблица = одномерный массив), а с многомерными массивами;
  • Array Functional Language (AFL) — «чистый» в функциональном смысле полностью эквивалентный AQL язык.

Партицирование данных и запросов, линейная алгебра, математическая статистика и машинное обучение из коробки.

В новой версии большое количество исправлений, оптимизаций производительности.

Появилась интеграция с MPICH и ScaLAPACK.

Доступны репозитории для CentOS 6.x, RedHat 6.x, Ubuntu 12.04.

Доступные интерфейсы:

  • Python
  • R
  • iquery (аналог консольного клиента)

В ближайшем будущем планируются:

  • RESTful API
  • JDBC-connector
  • ODBC-connector

SciDB используется:

  • банками
  • страховыми компаниями
  • генетиками
  • астрономами
  • платёжными системами

Из публично доступных примеров: 1000 Genomes Browser

>>> Скачать



Проверено: catap ()
Последнее исправление: catap (всего исправлений: 10)

Ответ на: комментарий от L_user

А я не про сборку boost, я про сборку проекта, использующего boost. Для этого в поставке идут BoostConfig.cmake, чтобы его подключать Я не понимаю КАК, но RHEL'овцы умудрились правильный файл испортить. Накосячит с путями. Самое обидное - workaround'ов, кроме как патчить пакет - нету. Ну или один файл из пакета, один фиг :(

zabivator
() автор топика

Отличный софт: открытый, современный, инновационный, качественный, мощный, прекрасно реализующий заявленные фичи.

Что примечательно, написан на С++ и Python. А не на каком-нибудь маргинальном псевдоилитарном небыдлоязычке, типа лишпа или какацкеля.

anonymous
()

А оно в каком формате данные хранит, в каком-то своём, или какой-нибудь HDF?

yvv ★★☆
()

Ох, вот это отлично! Может быть даже стоит воспользоваться...

michwill ★★★★★
()

О, вот как нумерация пошла. До этого честно признавались, что SciBD далеко не 1.0

Stalin ★★★★★
()

RedHat 6.x

RHEL же, не?

Deleted
()
Source
For build instructions see the file doc/build.txt
 scidb_12.12.0-5890.tar.gz
SciDB Source Tarball
(44.91 MiB) Downloaded 15 times


Documentation
 scidb-userguide-12.12.pdf
SciDB User Guide
(1.48 MiB) Downloaded 20 times

;)

AlexVR ★★★★★
()
Ответ на: комментарий от tailgunner

он просто свободен, а ты болен. рабством головного мозга

anonymous
()

Смотрели ли вы архитектуру TerraData, которая используется в Bank Of America?
Как ваша СУБД работает с большим числом записей, порядка 10^9 - 10^12?
Например, скорость join/sort?

pacify ★★★★★
()
Ответ на: комментарий от pacify

Я лично не смотрел, коллеги смотрели. С записями мы не работает, мы работаем с массивами. Работаем мы быстро. Насколько именно - сами понимаете, надо тестировать ваши кейсы

zabivator
() автор топика
Ответ на: комментарий от anonymous

Все бы хорошо, но я все равно на это поделие смотреть не буду - у них язык запросов функциональщиной пованивает.

anonymous
()
Ответ на: комментарий от zabivator

Я лично не смотрел, коллеги смотрели.

Опытные коллеги - это хорошо. Просто TerraData работает с огромными наборами данных, и реализует разделение ресурсов между пользователями. Это напоминает начало развития многопользовательских систем типа UNIX.

С записями мы не работаем, мы работаем с массивами.

Ну, многомерность - это хорошо. Мой коллега Костя Воронцов в
конце 90-х тоже писал кроссплатформенную библиотеку для анализа
данных, правда - под свои методики. Он с кафедры ММП ВМиК.

Работаем мы быстро. Насколько именно - сами понимаете, надо тестировать ваши кейсы.

То есть, теоретической оценки скорости сортировки у вас не имеется?
Например, в виде T(n) = O(n*log(n)).

pacify ★★★★★
()
Ответ на: комментарий от pacify

То есть, теоретической оценки скорости сортировки у вас не имеется?

Например, в виде T(n) = O(n*log(n)).

А, вам ассимптотику. Сортировка по значениям - O(n*log(n)), join'ы делаются по измерениям за O(n)

zabivator
() автор топика
Ответ на: комментарий от exception13

а как оно для general-purpose?

general-performance очевидно же :)

А вообще интересная штука. Можно попробовать будет наших крыс как-нибудь с помощью этой штуки организовать.

Vudod ★★★★★
()
Последнее исправление: Vudod (всего исправлений: 1)
Ответ на: комментарий от imtw

Я хотел сказать Contex, но вспомнил, что это ЛОР

zabivator
() автор топика
Ответ на: комментарий от zabivator

gpl3

Скорее «свободная и может быть бесплатная» така как лицензия gpl3. а сколько стоит для использования в коммерческом продукте?

anonymous
()
Ответ на: комментарий от psv1967

Я немного перепутал. R в платном дополнении - P4 :(

zabivator
() автор топика
Ответ на: gpl3 от anonymous

Нет, сама SciDB свободна и бесплатна.

zabivator
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.