Подскажите нормальную БД для которой существует неблокирующий сишный API

Постгрес, например. Хотя оно и у мускл есть, и у многих других, ЕМНИП

~~DllMain~~
(24.02.20 12:47:20 MSK)

Мне кажется прям совсем совсем неблокирующих не существует. А если существует то будут выстраиваться километровые очереди для последующей выборки и синхронизации при этом где то 10536`е соединение будет ждать чтения пока в 856 параллельных потоках разруляться зависимости очерёдности записи в одно и тоже место .

sqlite умеет в многопоток, но каждый поток должен ждать своей очереди на транзикацию. По остальным хз. Подписался.

Херач отдельную sqlite на каждого реганого клиента. Ну и пусть что 10000 баз будет =) Зато вжжууух… ~~и иноды кончились~~

LINUX-ORG-RU ★★★★★
(24.02.20 12:58:04 MSK)
Последнее исправление: LINUX-ORG-RU 24.02.20 13:00:34 MSK (всего исправлений: 1)

Ссылка

В первую очередь нужно задаться вопросом а выдержит ли СУБД такое кол-во одновременных соединений. Большинство СУБД не имеют аналогов event loop и тупо создают для кадого клиента процесс или поток, т.е. соединение для них весьма дорогое. И скорее всего СУБД раньше сдохнет от конкуренции за IOPSы.

Далее, если для СУБД нет подходящего клиента, разумно делать примерно как делает СУБД - т.е. если создаёт поток или процесс, то и у себя создаешь пул потоков с клиентами, а из event loop общаешься с ним очередями. Если СУБД распределённая, то для прикручивания асинхронности к сервису можно даже сделать несколько машин с такими сервисами.

anonymous
(24.02.20 13:37:54 MSK)

Микросервисы? Или что-то на erlang?

anonymous
(24.02.20 13:42:20 MSK)

Ссылка

Ответ на: комментарий от anonymous 24.02.20 13:37:54 MSK

Вы неправильно поняли вопрос. Неблокирующий сишный API как раз и позволяет имея 100500+ входящих http соединений не создавать столько-же исходящих к БД.

cvv ★★★★★
(24.02.20 13:51:45 MSK) автор топика

Ответ на: комментарий от cvv 24.02.20 13:51:45 MSK

Похоже на мифы

anonymous
(24.02.20 14:06:56 MSK)

Ссылка

Postgres.

anonymous
(24.02.20 14:44:34 MSK)

Ссылка

э, нее, у тебя там свои хттп-соединения? собственное приложение которому надо лезть в бд?

deep-purple ★★★★★
(24.02.20 14:47:59 MSK)

Ссылка

Ответ на: комментарий от cvv 24.02.20 13:51:45 MSK

Вовсе нет, неблокирующй API это асинхронный API, а ты хочешь мультиплексирование через одно соединение. Мультиплексирование и асинхронность фичи ортогональные.

Но это не важно, потому что всё в конечном счёте сводится к возможностям СУБД. Однонодовая однодисковая СУБД не потянет одновременно 100500+ запросов.

anonymous
(25.02.20 00:49:08 MSK)

Ответ на: комментарий от cvv 24.02.20 13:51:45 MSK

https://github.com/rootmos/libpquv/blob/master/src/include/pquv.h

https://www.pgpool.net/docs/41/en/html/intro-whatis.html

anonymous
(25.02.20 12:24:17 MSK)

Ссылка

Ответ на: комментарий от anonymous 25.02.20 00:49:08 MSK

Вовсе нет, неблокирующй API это асинхронный API, а ты хочешь мультиплексирование через одно соединение.

Извиняюсь, но вы путаетесь в терминологии. Вы наверное недавно пришли с Windows, в которой нет понятия неблокирующего API?

cvv ★★★★★
(25.02.20 12:28:01 MSK) автор топика

Вроде как тарантул подходит, но он не на libuv, а на libev
https://github.com/mailru/opensource.mail.ru/wiki/Tarantool

crutch_master ★★★★★
(25.02.20 12:32:34 MSK)

Ссылка

постря

Deleted
(25.02.20 12:46:03 MSK)

Ссылка

Ответ на: комментарий от DllMain 24.02.20 12:47:20 MSK

опыт с мускулем небольшой, мне кажется, что у постгри более очевидно. у firebird тоже есть, точно, но опыт очень маленький.

Deleted
(25.02.20 12:49:18 MSK)

Ссылка

Oracle.

LamerOk ★★★★★
(25.02.20 20:41:55 MSK)

Ссылка

я на какую-то странную х-ню в libuv наступила. иногда (когда точно, я так и не поняла) там при множестве повторных tcp соединений таймауты глючили. я пыталась дебажить, но пока не докопалась до сути проблемы. проблема возникала редко и только если соединений дофига.

Iron_Bug ★★★★★
(25.02.20 21:14:49 MSK)
Последнее исправление: Iron_Bug 25.02.20 21:15:31 MSK (всего исправлений: 1)

а насчёт БД - в каком смысле неблокирующий? сама БД если имеет констрейнты, то там всё равно будет блокирование. а так прикрути любые очереди и сри в очередь, а на другом конце сбрасывай в базу. никаких проблем.

Iron_Bug ★★★★★
(25.02.20 21:17:06 MSK)

Ссылка

Ответ на: комментарий от Iron_Bug 25.02.20 21:14:49 MSK

Кстати, а что бы ты лично использовала вместо libuv?

PS: Google-Chrome & Node.JS — оба крутятся на libuv

cvv ★★★★★
(26.02.20 01:04:04 MSK) автор топика

Ответ на: комментарий от cvv 25.02.20 12:28:01 MSK

Как это нет, есть

yoghurt ★★★★★
(26.02.20 17:08:41 MSK)

Ссылка

Ответ на: комментарий от cvv 26.02.20 01:04:04 MSK

не знаю. я бы не использовала ничего, если честно. для крупных проектов всегда писали сами всё с нуля. я просто переделывала чужую поделку и там с livbuv столкнулась. я ещё попробую подебажить и как-то на искусственном примере создать прецедент с таймерами, но это геморно. там проблема была в том, что при обращении с одного IP повторные TCP сессии не устанавливались и отваливались по таймауту. а происходило это из-за таймеров внутри libuv, хотя пакеты все ходили нормально, это я проверяла.

Iron_Bug ★★★★★
(26.02.20 19:30:42 MSK)
Последнее исправление: Iron_Bug 26.02.20 19:33:28 MSK (всего исправлений: 1)

Ответ на: комментарий от Iron_Bug 26.02.20 19:30:42 MSK

проблема была в том, что при обращении с одного IP повторные TCP сессии не устанавливались и отваливались по таймауту

Исчерпывалась очередь pending connections, accept() не успевали разгребать соединения? Только непонятно, причем тут обращения именно с одного IP…

Sorcerer ★★★★★
(26.02.20 19:44:36 MSK)
Последнее исправление: Sorcerer 26.02.20 19:44:51 MSK (всего исправлений: 1)

Ответ на: комментарий от cvv 26.02.20 01:04:04 MSK

Дык там нагрузки никакой. Вот автор h2o объясняет, почему ему не подошло. http://blog.kazuhooku.com/2014/09/the-reasons-why-i-stopped-using-libuv.html

fluorite ★★★★★
(26.02.20 19:53:58 MSK)

Ссылка

Ответ на: комментарий от cvv 25.02.20 12:28:01 MSK

Извиняюсь, но вы путаетесь в терминологии. Вы наверное недавно пришли с Windows, в которой нет понятия неблокирующего API?

Везде оно есть. Неблокирующее API лишь возвращает ошибку в случае, если состояние таково, что данные не могут быть прочитаны. Вся логика по работе с состоянием перекладывается на пользовательский код, вместо блокировок в ядре. Ты действительно хочешь мультиплексирование. Складывай запросы в очередь, разгребай ее в отдельном треде, а дальше складывай ответы в другую очередь.

xpahos ★★★★★
(27.02.20 05:17:49 MSK)

Доступ в БД обычно предоставляется через сокеты. С последними можно работать асинхронно, так что это вопрос исключительно к либам хелперам. Скорее всего придется писать свою либу, так как в асинхронном мире обычно проблематично сочетать компоненты, написанные разными людьми на разных технологиях. Собственно общий знаменатель асинхронности - сам сокет и любое апи поверх него не сочетаемо с любым другим ивент лупом. Если брать например rust, то там можно надеяться найти решение всего чего угодно через tokio, а в С++ всё всегда пишут синхронно, чтоб было проще интегрировать в любую велосипедную систему.

q0tw4 ★★★★
(27.02.20 17:01:55 MSK)

Ссылка

Ответ на: комментарий от xpahos 27.02.20 05:17:49 MSK

Не понимаю зачем тут вообще очереди. Есть аппликуха фасад, которая принимает хттп несколькими потоками воркерами. Эти воркеры пишут в БД синхронно или асинхронно (надо тестить что лучше). Роль очереди берет на себя система реализации сокетов. Всё.

q0tw4 ★★★★
(27.02.20 17:10:26 MSK)
Последнее исправление: q0tw4 27.02.20 17:17:01 MSK (всего исправлений: 1)

Ответ на: комментарий от q0tw4 27.02.20 17:10:26 MSK

Не понимаю зачем тут вообще очереди. Есть аппликуха фасад, которая принимает хттп несколькими потоками воркерами. Эти воркеры пишут в БД синхронно или асинхронно (надо тестить что лучше). Роль очереди берет на себя система реализации сокетов. Всё.

Как определить в какой контекст отдать данные после текущего чтения?

xpahos ★★★★★
(27.02.20 17:30:30 MSK)

Ответ на: комментарий от xpahos 27.02.20 17:30:30 MSK

Вопервых работать с БД можно синхронно. Других клиентов обслужат другие воркеры. Очередью будет хттп сокет. Во-вторых можно формировать SQL так, чтоб из ответа был понятен контекст (SELECT $requestId, data). Да мало ли еще способов в зависимости от конкретики задачи

q0tw4 ★★★★
(27.02.20 17:35:09 MSK)

Ответ на: комментарий от Sorcerer 26.02.20 19:44:36 MSK

нет. всё в порядке с коннектами и с пакетами. проблемы именно в таймерах библиотеки. они срабатывали не вовремя. я этот момент прямо отлавливала. таймер срабатывал сразу после запуска его ожидания, хотя событие ещё не произошло и из-за этого потом сессии наворачивались. но у меня musl, есть вероятность, что там где-то внутри просто не чистится память. но это только одна из гипотез. отловить эту фигню сложно, ибо возникает она только при интенсивной нагрузке с множеством коннектов. но утечек или каких-то нарушений обращений к памяти при этом нет. если я найду, в чём проблема, я им напишу.

Iron_Bug ★★★★★
(27.02.20 22:32:18 MSK)

Ссылка

Ответ на: комментарий от q0tw4 27.02.20 17:35:09 MSK

Вопервых работать с БД можно синхронно.

В event loop работать с БД синхронно?

Других клиентов обслужат другие воркеры.

Зачем тогда event loop?

Во-вторых можно формировать SQL так, чтоб из ответа был понятен контекст (SELECT $requestId, data).

Еще можно придумать кучу способов выдать свой бред за что-то нормальное.

xpahos ★★★★★
(28.02.20 05:28:07 MSK)

Ответ на: комментарий от xpahos 28.02.20 05:28:07 MSK

Ну ок. Это не ивент луп, а просто тредпул. Просто, удобно и совместимо. Ну или пишите на расте, там всё через tokio можно пустить

q0tw4 ★★★★
(28.02.20 11:51:59 MSK)

Ответ на: комментарий от q0tw4 28.02.20 11:51:59 MSK

Ну ок. Это не ивент луп, а просто тредпул. Просто, удобно и совместимо.

Это совсем другая модель работы и совсем другое поведение. Оно не проще, не удобнее, на совместимость не влияет.

Ну или пишите на расте, там всё через tokio можно пустить

При чем тут Rust? Это такая же библиотека, как libuv, libevent или самописный обработчик на epoll/kqueue/select.

xpahos ★★★★★
(28.02.20 12:50:03 MSK)

Ответ на: комментарий от xpahos 28.02.20 12:50:03 MSK

Это такая же библиотека, как libuv

Разница в том, что под libuv и прочие поделки никто не пишет либы разных протоколов (ну по крайней мере на сайте БД вряд ли будут лежать либы, работающие через васин ивентлуп). А в расте tokio - стандарт. Почти для каждого протокола Х, для которого есть синхронный крейт находится человек, оборачивающий данный протокол в tokio.

q0tw4 ★★★★
(28.02.20 15:56:51 MSK)

в хайлоадах на кафку смотрят. ее можно как БД использовать

bvn13 ★★★★★
(28.02.20 15:58:12 MSK)

Ответ на: комментарий от bvn13 28.02.20 15:58:12 MSK

Я вот тоже на нее смотрю. Может начну пихать везде, начиная от задач логирования

q0tw4 ★★★★
(28.02.20 16:57:24 MSK)

Ссылка

Ответ на: комментарий от xpahos 28.02.20 05:28:07 MSK

Во-вторых можно формировать SQL так, чтоб из ответа был понятен контекст (SELECT $requestId, data).

Еще можно придумать кучу способов выдать свой бред за что-то нормальное.

Даже почта по IMAP работает асинхронно. К каждому запросу есть ID, который возвращается в соответствующем ответе.

gag ★★★★★
(28.02.20 17:34:16 MSK)
Последнее исправление: gag 28.02.20 17:34:45 MSK (всего исправлений: 1)

Ответ на: комментарий от anonymous 25.02.20 00:49:08 MSK

при большом количестве входящих http соединений — over 30k.

Однонодовая однодисковая СУБД не потянет одновременно 100500+ запросов.

Даже у десктопных PCIe NVMe SSD 600000 4K IOPS. Почему бы и нет.

gag ★★★★★
(28.02.20 17:38:51 MSK)

Ссылка

Ответ на: комментарий от q0tw4 28.02.20 15:56:51 MSK

Разница в том, что под libuv и прочие поделки никто не пишет либы разных протоколов (ну по крайней мере на сайте БД вряд ли будут лежать либы, работающие через васин ивентлуп).

Все адекватные разработчики — пишут.

cvv ★★★★★
(28.02.20 17:38:52 MSK) автор топика

Ссылка

Ответ на: комментарий от Iron_Bug 26.02.20 19:30:42 MSK

а происходило это из-за таймеров внутри libuv

А как сильно там было прибито к libuv, может, было бы быстрее попробовать заменить на libev?

gag ★★★★★
(28.02.20 17:50:48 MSK)

Не всё так просто. Надо ставить несколько инстансов субд и уже к ним коннектиться из пулла коннектов, а к пулу обращаться из libuv loop. А лучше взять Node.js 😀

menangen ★★★★★
(28.02.20 19:28:19 MSK)

Ссылка

Ответ на: комментарий от gag 28.02.20 17:50:48 MSK

достаточно сильно. там были асинхронные вызовы.

Iron_Bug ★★★★★
(28.02.20 19:38:24 MSK)

Ссылка

redis йопта!

А ваще, ты как себе представляешь 30k стуков об базу, какая бы она не была - это диск - это просадка.

Нужно брать прокладку на с++( некий деман ) в нём держать всю базу в раме, и по таймауту - сохраняца в базу на диск.

Если рамы не хватает - докупать.

anonymous
(01.03.20 19:01:12 MSK)

Ответ на: комментарий от anonymous 01.03.20 19:01:12 MSK

А ваще, ты как себе представляешь 30k стуков об базу, какая бы она не была - это диск - это просадка.

это херня, а не нагрузка.

anonymous
(02.03.20 19:34:11 MSK)

Ссылка

Ответ на: комментарий от anonymous 01.03.20 19:01:12 MSK

А ваще, ты как себе представляешь 30k стуков об базу, какая бы она не была - это диск - это просадка.

реальные проблемы у Постгреса начинаются после 100к, тем не менее некоторым удается получить несколько миллионов инсертов в секунду.

cvv ★★★★★
(03.03.20 00:01:43 MSK) автор топика
Последнее исправление: cvv 03.03.20 00:02:33 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от gag 28.02.20 17:34:16 MSK

Даже почта по IMAP работает асинхронно. К каждому запросу есть ID, который возвращается в соответствующем ответе.

Я много могу назвать протоколов асинхронных. Но они не предназначены для near real-time запросов к СУБД. API в таком виде не очень хороший вариант.

xpahos ★★★★★
(03.03.20 02:55:39 MSK)

Ссылка

Ответ на: комментарий от DllMain 24.02.20 12:47:20 MSK

Благодарю. Взлетело. 150к инсертов в секунду. Я счастлив.

cvv ★★★★★
(07.03.20 17:57:35 MSK) автор топика

Ссылка

Похожие темы