Как нужно зарабывать деньги на OpenSource

memsql

0

2

Для Ъ:

Компания MemSQL, предлагающая решение для радикального ускорения реляционных баз данных, получила на этой неделе $3 млн. инвестиций и представила готовый продукт.

MemSQL основал хорошо известный екатеринбургской и питерским «диаспорам» программистов Никита Шамгунов, ушедший делать стартап с позиции старшего разработчика Microsoft SQL Server, и его партнеры - экс-коллега по Microsoft Адам Праут и экс-разработчик Facebook Эрик Френкель (входит в 30-ку лучших молодых техно-инноваторов по версии журнала Forbes).

Авторы ставят задачу ускорения работы с БД в 30 раз. При этом существующий софт не потребует существенной модификации, так как MemSQL поддерживает MySQL протокол. Фактически MemSQL можно рассматривать как быстродействующую память, успешно дополняющую хранилище на жёстких дисках.

В двух раундах их стартап MemSQL привлёк уже чуть больше $5 млн. от Эштона Катчера, Y Combinator, Digital Sky Technologies и других инвесторов, сообщает новостная лента Dow Jones.

Основатели MemSQL и их инвесторы делают ставку на постоянный рост объёмов непрерывно обрабатываемых данных. Известно, что в банковском секторе, логистике, транспорте — их объём растет вдвое каждые полтора года.

Вот так все красиво написано (https://s3.amazonaws.com/press.memsql.com/MemSQL_launch_release.pdf). А теперь что они сделали в 2-х словах:

Взяли Mysql и засунули его в память и даже похоже что исходники не открыли.

Ссылка

← идея насчет портирования игр от крупных разработчиков на линукс

Firefox - решето →

← 1 2 →

Почему ты так не любишь Ъ?

AntonK
(21.06.12 09:38:27 MSK)

Ссылка

что это?

~~drBatty~~ ★★
(21.06.12 09:44:50 MSK)

Ссылка

по ссылке маркетинговый буллшит. Оно хотя бы может соревноваться с sqlite(':memory:') или mysql с memory engine ? :)

true_admin ★★★★★
(21.06.12 09:49:39 MSK)

Будь ласка, принеси це на ЛОР для Ъ.

~~delete83~~ ★★
(21.06.12 10:00:48 MSK)

Ответ на: комментарий от delete83 21.06.12 10:00:48 MSK

Пфф! pdf еще. За такие ссылки скор снимать нужно, я считаю.

~~delete83~~ ★★
(21.06.12 10:01:16 MSK)

Взяли Mysql и засунули его в память

$3 млн

Не, ну это вообще пушка.

dismal_faun ★★
(21.06.12 11:33:34 MSK)

Ответ на: комментарий от true_admin 21.06.12 09:49:39 MSK

Прозреваю, что внутри либо NDB, либо sqlite(':memory:'), либо SQL-обвязка вокруг Redis/KyotoCabinet, и где-то в недрах /usr/share/doc/memsql/COPYRIGHT хитрая рожа Денискина. Как по-другому за неделю представить готовый продукт, даже за 3 мегабакса, я слабо представляю.

shimon ★★★★★
(21.06.12 11:35:02 MSK)

Ответ на: комментарий от dismal_faun 21.06.12 11:33:34 MSK

Не, ну это вообще пушка.

Куда смотрит Навальный?!

shimon ★★★★★
(21.06.12 11:35:32 MSK)

ничего, gpl-viloations их вскоре за жопу возьмет.

~~dikiy~~ ★★☆☆☆
(21.06.12 11:52:16 MSK)

Ссылка

В двух раундах их стартап MemSQL привлёк уже чуть больше $5 млн. от Эштона Катчера

Это что, тот Кучер, который в «Эффекте бабочки» играл, еще и SQL-базы спонсирует? Ну теперь он однозначно мой любимый актер.

Yasenfire
(21.06.12 12:00:51 MSK)

Ответ на: комментарий от shimon 21.06.12 11:35:02 MSK

я уже скачиваю, но оно весит 114 метров в архиве, на моём канале это займёт время. Но я уже вижу «MemSQL is wire-compatible with MySQL». Там grep mysql почти ничего не находит, но... Знаешь, когда в errmesage пишут «Do you already have another mysqld server?» тут всё становитсяя понятно.

Но я ещё поковыряюсь

true_admin ★★★★★
(21.06.12 12:10:07 MSK)

Взяли Mysql и засунули его в память

Хабраэксперт?

MemSQL places data into memory and translates SQL into C++ for the utmost optimization in query execution.

~~power~~ ★
(21.06.12 12:14:21 MSK)

Ответ на: комментарий от power 21.06.12 12:14:21 MSK

translates SQL into C++

О_О до чего техника дошла!

AntonK
(21.06.12 12:15:55 MSK)

Ссылка

Ответ на: комментарий от shimon 21.06.12 11:35:02 MSK

честно говоря, пока явных следов mysql не нашёл.

true_admin ★★★★★
(21.06.12 12:16:04 MSK)

Ответ на: комментарий от true_admin 21.06.12 12:10:07 MSK

114 метров в архиве

В архиве есть исходники?

~~power~~ ★
(21.06.12 12:17:40 MSK)

Ответ на: комментарий от shimon 21.06.12 11:35:32 MSK

Куда смотрит Навальный?!

А разве это деньги Навального воруют?

~~demmsnt~~ ★
(21.06.12 13:01:24 MSK)

Ссылка

Ответ на: комментарий от delete83 21.06.12 10:01:16 MSK

Предпочитаешь docx?

leave ★★★★★
(21.06.12 14:21:55 MSK)

Ответ на: комментарий от leave 21.06.12 14:21:55 MSK

Предпочитаю plaintext

~~delete83~~ ★★
(21.06.12 14:25:12 MSK)

Ответ на: комментарий от true_admin 21.06.12 12:16:04 MSK

mysql -u root -h 127.0.0.1 -P 3307 --prompt=«memsql> »

ИМХО этого хватит, чтобы взять за жопу за нарушение GPL, если сырцов нет.

leave ★★★★★
(21.06.12 14:26:45 MSK)

Ответ на: комментарий от true_admin 21.06.12 12:16:04 MSK

120621 13:29:55 [Note] ./memsqld: Normal shutdown

120621 13:29:55 [Note] ./memsqld: Shutdown complete

leave ★★★★★
(21.06.12 14:30:41 MSK)

Ответ на: комментарий от delete83 21.06.12 14:25:12 MSK

Где ты видел маркетоидные материалы без графичков?

leave ★★★★★
(21.06.12 14:31:42 MSK)

Ссылка

Ответ на: комментарий от leave 21.06.12 14:26:45 MSK

чтобы взять за жопу за нарушение GPL

не факт. Это всего лишь протокол.

true_admin ★★★★★
(21.06.12 14:57:57 MSK)

Ссылка

Ответ на: комментарий от power 21.06.12 12:17:40 MSK

В архиве есть исходники?

есть, но, похоже, не самой тулзы а сопутствующих либ итп.

true_admin ★★★★★
(21.06.12 14:58:35 MSK)

Ссылка

Ответ на: комментарий от leave 21.06.12 14:30:41 MSK

Shutdown complete

ну вот да, настораживает :). Я через objdump прогнал бинари, но сходу ничего не нашёл подозрительного. Возможно, они sed-ом выпилили все упоминания mysql, хз :).

К сожалению нет времени ковыряться.

true_admin ★★★★★
(21.06.12 15:04:37 MSK)

Ссылка

Короче, всё бы объяснили бенчмарки. Я так и не понял степень стыренности с mysql. А так же нет цен.

true_admin ★★★★★
(21.06.12 15:22:21 MSK)

Ссылка

В двух раундах их стартап MemSQL привлёк уже чуть больше $5 млн. от Эштона Катчера

Казалось бы - причём тут Эштон Катчер?

~~max_udoff~~
(21.06.12 15:23:41 MSK)

Ссылка

Эштон реально возомнил себя ~~Джобс~~ом. :D
Вот что роль в фильме с людьми делает...

Turbo_Mascal ★
(21.06.12 15:30:04 MSK)

Ссылка

Чем оно лучше MySQL + memory engine?

И да, про ускорение - маркетинговый бред.

Deleted
(21.06.12 16:12:46 MSK)

Ссылка

Ответ на: комментарий от power 21.06.12 12:14:21 MSK

translates SQL into C++

Мамочки...

Manhunt ★★★★★
(21.06.12 16:13:03 MSK)

Ответ на: комментарий от Manhunt 21.06.12 16:13:03 MSK

Мамочки...

они просто убрали «посредника», на деле запрос так или иначе дергает плюсовые (сишные) методы, пусть запрос был преобразован в набор команд для VM, или это обход дерева от парсера, можно конечно закешировать программу для VM или то же дерево, но лишние действия будут оставаться; другой вопрос - много ли они от этого выиграют, как по мне - погоды оно не сделает

~~wota~~ ★★
(21.06.12 16:19:59 MSK)

Ответ на: комментарий от power 21.06.12 12:14:21 MSK

and translates SQL into C++ for the utmost optimization in query execution

C++ же известен тем, что для него принципиально невозможно создать быстрый компилятор/интерпретатор. Да и вообще C++ никак не подходит на роль промежуточного языка. Раз уж захотели повысить производительность за счет компиляции запросов вместо интерпретации (очень сомнительная техника в данном случае), то ИМХО намного адекватнее - заюзать LLVM или что-то подобное.

Deleted
(21.06.12 16:21:17 MSK)

Ответ на: комментарий от wota 21.06.12 16:19:59 MSK

они просто убрали «посредника»

Напротив, добавили лишнего посредника: теперь им нужно дергать компилятор с++.

VM

«Semantics of C and C++ are described in terms of a theoretical «abstract machine»»

Manhunt ★★★★★
(21.06.12 16:29:46 MSK)

Ответ на: комментарий от Deleted 21.06.12 16:21:17 MSK

C++ же известен тем, что для него принципиально невозможно создать быстрый компилятор/интерпретатор.

скопилировать одну единицу, где будут только несколько прототипов функций + код без шаблонов и пр., можно практически моментально

Да и вообще C++ никак не подходит на роль промежуточного языка

представь цикл для обхода курсора, код на С++ напрямую дергает API СУБД (включая приватные методы), все работает с максимальной скоростью, код на SQL же интерпретируется и выполняются лишние побочные действия

то ИМХО намного адекватнее - заюзать LLVM или что-то подобное.

возможно они его и взяли

~~wota~~ ★★
(21.06.12 16:31:35 MSK)

Ответ на: комментарий от Manhunt 21.06.12 16:29:46 MSK

Напротив, добавили лишнего посредника: теперь им нужно дергать компилятор с++.

но удалили интерпретатор

«Semantics of C and C++ are described in terms of a theoretical «abstract machine»»

речь идет о рантайме

~~wota~~ ★★
(21.06.12 16:33:04 MSK)

Ответ на: комментарий от wota 21.06.12 16:33:04 MSK

но удалили интерпретатор

Делать JIT посредством C++, это всё равно, что удалять гланды через заднепроходное отверстие.

Manhunt ★★★★★
(21.06.12 16:39:31 MSK)

Ответ на: комментарий от Manhunt 21.06.12 16:39:31 MSK

гуру предложит лучший метод?

~~wota~~ ★★
(21.06.12 16:40:06 MSK)

Ответ на: комментарий от Yasenfire 21.06.12 12:00:51 MSK

Это единственный годный фильм с ним.

sophus_solus
(21.06.12 16:42:19 MSK)

Ссылка

Оракл же уже обещал ускорение MySQL на 1500%. Они его перегнали?

buddhist ★★★★★
(21.06.12 16:47:05 MSK)

Ссылка

Основатели MemSQL и их инвесторы делают ставку на постоянный рост объёмов непрерывно обрабатываемых данных

их объём растет вдвое каждые полтора года

У них-таки есть способ преодолеть экспоненциальный рост?

buddhist ★★★★★
(21.06.12 16:48:26 MSK)

Ссылка

Ответ на: комментарий от wota 21.06.12 16:40:06 MSK

Если только там не подмножество C++.

buddhist ★★★★★
(21.06.12 16:49:44 MSK)

Ссылка

Ответ на: комментарий от wota 21.06.12 16:31:35 MSK

скопилировать одну единицу, где будут только несколько прототипов функций + код без шаблонов и пр., можно практически моментально

Но это все равно будет медленно. Медленнее, чем если бы вместо C++ сразу генерировался LLVM-байткод, а из него - нативный код. Тем более, что если там действительно несколько прототипов + код без шаблонов, то за счет C++ нет выигрыша даже в плане простоты.

представь цикл для обхода курсора, код на С++ напрямую дергает API СУБД (включая приватные методы), все работает с максимальной скоростью, код на SQL же интерпретируется и выполняются лишние побочные действия

Все это можно реализовать, выбрав намного более подходящий на роль промежуточного язык. Тот же LLVM-биткод.

возможно они его и взяли

Есть разница между «использовать компилятор C++, использующий LLVM» и «использовать LLVM». В первом случае добавляется еще несколько промежуточных слоев, один из которых очень времязатратный.

Ах да, ради компиляции C++ нужно дергать внешнюю программу (если, конечно, они не используют libclang) и, если они не используют libclang, дергать файловую систему. Две очень дорогостоящие операции.

Deleted
(21.06.12 16:53:26 MSK)

Ответ на: комментарий от Manhunt 21.06.12 16:39:31 MSK

JIT посредством C++ не дает тех плюшек, которые дает обычный JIT в сравнении со статической компиляцией.

Deleted
(21.06.12 16:57:37 MSK)

Ссылка

Ответ на: комментарий от Deleted 21.06.12 16:53:26 MSK

Медленнее, чем если бы вместо C++ сразу генерировался LLVM-байткод, а из него - нативный код
Тот же LLVM-биткод.

генерированный код должен дергать плюсовое API СУБД, генерация «LLVM-байткода» потребует от тебя написания своего компилятора под плюсовое ABI - сизифов труд, clang сделает это за тебя без особого оверхеда, причем твой код будет гораздо более прозрачен и понятен

Ах да, ради компиляции C++ нужно дергать внешнюю программу (если, конечно, они не используют libclang) и, если они не используют libclang, дергать файловую систему. Две очень дорогостоящие операции.

давай еще предположим, что clang будет располагаться на далеком сервере и оттуда же будет присылаться результат :) конечно же надо брать libclang, ее для этого и сделали

~~wota~~ ★★
(21.06.12 17:01:50 MSK)

Ответ на: комментарий от wota 21.06.12 16:40:06 MSK

гуру предложит лучший метод?

Использовать специальные инструменты, предназначенные для JIT. LLVM, GNU Lightning, libjit.

И еще вот какое соображение. Общее время работы складывается из времени-на-компиляцию и времени-на-исполнение. Если ты используешь слишком умный компилятор (скажем, g++ -Ofast), то может оказаться, что он потратит на компиляцию в тысячи раз больше времени, чем примитивнейший интерпретатор потратил бы на исполнение той же программы. В случае JIT есть возможность расставить профилирующие счетчики, и по мере работы программы инвестировать процессорное время в оптимизацию лишь тех участков кода, где она действительно оправдана - согласно показаниям счетчиков. Как видишь, c++ тут совсем не в тему.

Manhunt ★★★★★
(21.06.12 17:08:56 MSK)

Ответ на: комментарий от wota 21.06.12 17:01:50 MSK

генерированный код должен дергать плюсовое API СУБД, генерация «LLVM-байткода» потребует от тебя написания своего компилятора под плюсовое ABI - сизифов труд, clang сделает это за тебя без особого оверхеда, причем твой код будет гораздо более прозрачен и понятен

Если так уж нереально лень напрямую работать с плюсовым ABI, то можно сделать к плюсовому мускулю сишный апи, тогда никаких ABI-трудностей не будет.

clang сделает это за тебя без особого оверхеда

Компилировать C++, когда этого возможно избежать - это «без особого оверхеда»?

давай еще предположим, что clang будет располагаться на далеком сервере и оттуда же будет присылаться результат :) конечно же надо брать libclang, ее для этого и сделали

Мы же не видели, как они это сделали. Может, там вообще не clang используется?

Deleted
(21.06.12 17:13:45 MSK)

Ответ на: комментарий от Manhunt 21.06.12 17:08:56 MSK

Использовать специальные инструменты, предназначенные для JIT. LLVM, GNU Lightning, libjit.

вы сначала скажите - к чему вы будете JIT применять, что это за промежуточный код - откуда он возьмется и что он будет дергать?

Если ты используешь слишком умный компилятор (скажем, g++ -Ofast), то может оказаться, что он потратит на компиляцию в тысячи раз больше времени, чем примитивнейший интерпретатор потратил бы на ее исполнение.
В случае JIT есть возможность расставить профилирующие счетчики, и по мере работы программы инвестировать процессорное время в оптимизацию лишь тех участков кода, где она действительно оправдана - согласно показаниям счетчиков.

все просто - определенный запрос долго выполняется и так уже несколько раз? марш на компиляцию

~~wota~~ ★★
(21.06.12 17:17:54 MSK)

Ответ на: комментарий от Deleted 21.06.12 17:13:45 MSK

можно сделать к плюсовому мускулю сишный апи

городить для плюсового ядра сишный API со своим оверхедом и лишним кодом..., можно конечно, но зачем? для упрощения своей жизни? ну так есть еще более простой вариант, вы его знаете

Компилировать C++, когда этого возможно избежать - это «без особого оверхеда»?

ес-но - времени это займет минимум, гораздо меньше чем выполняются тяжелые запросы

Мы же не видели, как они это сделали. Может, там вообще не clang используется?

может

~~wota~~ ★★
(21.06.12 17:22:20 MSK)

Ответ на: комментарий от wota 21.06.12 17:22:20 MSK

ес-но - времени это займет минимум, гораздо меньше чем выполняются тяжелые запросы

Дело в том, что большинство запросов к базе тяжелыми или слишком сложными не являются. Их быстрее проинтерпретировать, чем тратить процессорное время на C++.

Deleted
(21.06.12 17:30:56 MSK)

Ответ на: комментарий от wota 21.06.12 17:17:54 MSK

вы сначала скажите - к чему вы будете JIT применять, что это за промежуточный код

Это тот самый код, который авторы зачем-то генерируют для абстрактной машины c++.

Manhunt ★★★★★
(21.06.12 17:31:37 MSK)

Ответ на: комментарий от Deleted 21.06.12 17:30:56 MSK

Дело в том, что большинство запросов к базе тяжелыми или слишком сложными не являются

сделать миллион вставок - не тяжело, не сложно, но если СУБД отловит такой момент, то его можно значительно ускорить

~~wota~~ ★★
(21.06.12 17:35:24 MSK)

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

← идея насчет портирования игр от крупных разработчиков на линукс

Talks

Firefox - решето →

Похожие темы