Его крокейшество о вредности СУБД, если архитектурно она для программ, а не живого человека

0

5

Давно уже что-то про Столярова Croco ничего не было =) А тут он повод недавно дал, расписав почему считает недопустимым использовать СУБД в архитектуре при проектировании софта. То есть, если для каких-то программ нужно хранение данных, его надо индивидуально под программу делать, а не подключать базы данных.

Можно обсудить. В принципе я сам не люблю для локальных данных применять базы данных, часто достаточно просто текстовых файлов и это даже надежно и быстро. Но в целом каким-то луддизмом отдает. Его сообщение ниже:

http://www.stolyarov.info/guestbook#cmt97

==============

Я придерживаюсь принципа несколько более узкого: недопустимо создание, распространение и использовние программ, для работы которых требуется СУБД.

Причины можно назвать, например, такие:

СУБД — это лишняя внешняя зависимость, при том что вообще любые внешние зависимости суть хамство в отношении пользователей и мейнтейнеров;
СУБД требует трудозатрат на установку, настройку и дальнейшее администрирование;
СУБД способна упасть (и да, падает намного чаще, чем, скажем, тот же апач — вообще пока мои сайты жили на «традиционной» CMSке, именно СУБД была причиной всех случаев downtime моих сайтов, за исключением одного, когда на сервере физически осыпался жёсткий диск);
СУБД требует от пользователя постоянно обновлять навыки, которые, возможно, больше ни для чего не нужны;
СУБД хранит информацию пользователя в неочевидном для него виде; этим грешат не только СУБД, конечно, но СУБД мало того что хранят всё в бинарных файлах, которые без самой СУБД даже думать нечего разобрать, они ещё и вводят дополнительный слой хаотизации в виде схемы БД, провоцируя разработчиков софта на внедрение «решений», единственное «описание» которых остаётся в голове у автора;
СУБД требует изрядных вычислительных мощностей и крадёт (а вовсе не повышает, как почему-то многие уверены) производительность.

Я, заметим, не рискну утверждать, что СУБД как сущность вообще никогда не может ни для чего применяться. Тут вопрос в том, кто на ком стоял: если главной целью является база данных как таковая, то есть вот имеется какой-то значительный объём разнородной, но при этом взаимосвязанной информации и стоит задача обеспечить его хранение и в нём поиск, причём никто заранее не знает, какие именно задачи будут решаться на этом массиве информации, какие именно поисковые запросы будут делаться и вот это вот всё, то да, СУБД вполне может оказаться адекватным решением, и даже для работы с ней могут создаваться вспомогательные программки. Это, конечно, не оправдывает существования языка SQL, который в любых его проявлениях представляет собой надругательство над здравым смыслом, но в целом СУБД как вид софта существовать, наверное, всё-таки может — но лишь в случаях, когда либо вообще нет никаких программ кроме неё самой, либо программы делаются для неё, а не она сама поддерживается для работы какой-то программы.

Всё это можно выразить и короче: СУБД, по-видимому, вполне имеет право на существование в ситуации, когда основным способом работы с ней будет непосредственное вбивание запросов на её языке запросов живым человеком. То есть когда именно вот это — основное, а всё остальное вспомогательное. В подавляющем большинстве случаев мы видим прямо противоположное: с СУБД как-то там общается некая программа (намного реже — больше одной программы, и это уже пограничный случай), а живой человек делает запросы либо только в рамках обслуживания всей системы, либо вообще никогда.

Когда же пишется некая программа, предполагающая применение для конкретных задач (а программы иначе, собственно, и не пишутся), и данные возникают исходя из этих задач, а не наоборот, то за саму идею задействования внешней СУБД нужно убивать на месте. Сугубо из санитарных соображений.

Ссылка

←	Каких авторов стоит смотреть по с++ на Ютубе?

html canvas, линии, координаты, пиксельные буферы, OffscreenCanvas и прочее безумие.

→

← 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 →

Ответ на: комментарий от Zhbert 30.09.25 14:39:22 MSK

KMyMoney ещё, вроде, может

kaldeon ★
(30.09.25 14:48:06 MSK)

Ссылка

Ответ на: комментарий от pekmop1024 30.09.25 14:41:19 MSK

Да не, он довольно быстро и легко обновляться из репы, если не запускать. Если запустил → начнутся пляски с последовательным обновлением по версиям.

Zhbert ★★★★★
(30.09.25 14:49:55 MSK)

Ответ на: комментарий от x3al 30.09.25 14:38:02 MSK

Да. И дальше вопрос, сможет ли оптимизатор сообразить SELECT DISTINCT ... ORDER BY day DESC LIMIT 5 сделать, не читая всю таблицу (скажем, там 200ГБ, а за последние 5 дней всего мегабайт).

Для своей структуры хранения алгоритм тривиальный.

monk ★★★★★
(30.09.25 14:49:59 MSK)

Ответ на: комментарий от monk 30.09.25 10:08:02 MSK

И которые по сути задачи не обязаны быть текстом.

Тут нужно определиться:

у нас есть std::string, которые хранят текст. Этот текст мы храним, например, в UTF-8. И, соответственно, валидируем, где нужно, входящие данные. Такие вещи мы отображаем в БД через varchar или что там есть еще в конкретной СУБД;
у нас есть std::string, которые хранят бинарные данные. Соответственно, отображаем их в БД как BLOB-ы.

Задача программиста делать так, чтобы одни std::string не перепутались с другими. Например, посредством какого-то из вариантов самодельных strong typedef.

Для BLOB’ов SQL не умеет ни сортировку, ни индексы ни внешние ключи…

Тут ниже уже ситуацию прояснили более знающие люди. Но я другого не пойму: если у вас бинарные данные (например, видео-кадры или фрагменты аудио-потока), то зачем их сортировать, индексировать и т.д.?

Если логи ограничены UTF-8, то имя будет закодировано в какой-нибудь base64.

base64 нечитабельна для человека. Удобнее символы, которые не могут быть представлены в UTF-8/ASCII, оформлять в виде escape-последовательностей.

Ну и заодно:

Но логи обычно не ограничивают какой-то кодировкой (я такого не видел).

Если вы не ведете логи в бинарном виде, то логично писать логи в том виде, в котором текст представляется в программе. Насколько я могу судить, в большинстве случаев сейчас это UTF-8. Но под Windows доводилось видеть и в UCS-2 (или как там сейчас правильно виндовый двубайтовых Unicode называется).

eao197 ★★★★★
(30.09.25 14:58:49 MSK)

Ответ на: комментарий от eao197 30.09.25 14:58:49 MSK

Тут ниже уже ситуацию прояснили более знающие люди. Но я другого не пойму: если у вас бинарные данные (например, видео-кадры или фрагменты аудио-потока), то зачем их сортировать, индексировать и т.д.?

У меня «бинарные данные» имена файлов, например. Их надо как-то сортировать для обработки (например, чтобы можно было продолжить обрабатывать после перезапуска). А ещё по имени файла может быть список тэгов, то есть это имя должно быть первичным/внешним ключом.

Насколько я могу судить, в большинстве случаев сейчас это UTF-8.

В большинстве. Но попадаются в текстовых логах и koi8 и iso8859. Текстовый лог не падает и vim’ом читается.

monk ★★★★★
(30.09.25 15:07:19 MSK)

Ответ на: комментарий от monk 30.09.25 15:07:19 MSK

У меня «бинарные данные» имена файлов, например.

Имена файлов в которых есть не-ASCII и не Unicode-символы? Аху***ть!

ССЗБ

Но зачем?

Их надо как-то сортировать для обработки (например, чтобы можно было продолжить обрабатывать после перезапуска).

Разные варианте escaping-а (хоть С-шный, хоть percent encoding из URL) должен был бы спасти отца русской демократии.

eao197 ★★★★★
(30.09.25 15:11:52 MSK)

Ответ на: комментарий от monk 30.09.25 14:15:46 MSK

Сорян, я в плейграунде проверял корректность запросов, которые писал из головы. Надо проверять на живой базе, а мне откровенно лень сейчас, равно как и курить доки по внутряне постгри.

leave ★★★★★
(30.09.25 15:22:21 MSK)

Ответ на: комментарий от eao197 30.09.25 15:11:52 MSK

Имена файлов в которых есть не-ASCII и не Unicode-символы? Аху***ть!

Имена файлов в koi8 (копия каталога со старого диска 25-летней давности), имена файлов в cp1251 (с ASPLinux) …

И все программы, с которыми я туда лазил, с ними вполне успешно работают (матерятся в консоли на ошибки конвертации, рисуют квадратики в списке файлов, но открывают).

Разные варианте escaping-а (хоть С-шный, хоть percent encoding из URL) должен был бы спасти отца русской демократии.

Я не спорю. Просто пример структуры, которая в SQL без обработки не ложится.

monk ★★★★★
(30.09.25 15:25:58 MSK)

Ответ на: комментарий от leave 30.09.25 15:22:21 MSK

Ладно, то просто любопытно было.

monk ★★★★★
(30.09.25 15:27:18 MSK)

Ссылка

Ответ на: комментарий от Zhbert 30.09.25 14:49:55 MSK

Да не, он довольно быстро и легко обновляться из репы, если не запускать. Если запустил → начнутся пляски с последовательным обновлением по версиям.

Поэтому проще и правильне использовать контейнер. Его и обновлять можно без плясок с бубном. Постгрю особенно если использовать внешнюю. Тащемта у меня есть эксперимент: Gitlab CE, который висит на автообновлении в Watchtower. Больше полугода уже висит, обновляется себе, кушать не просит.

pekmop1024 ★★★★★
(30.09.25 15:30:12 MSK)

Ссылка

Ответ на: комментарий от monk 30.09.25 15:25:58 MSK

Просто пример структуры, которая в SQL без обработки не ложится.

Я думаю, что описанные вами случаи будут вести к проблемам не только в случае с SQL.

eao197 ★★★★★
(30.09.25 15:32:12 MSK)

Ответ на: комментарий от eao197 30.09.25 15:32:12 MSK

Я думаю, что описанные вами случаи будут вести к проблемам не только в случае с SQL.

Вряд ли. В gtk работают, в vim работают, в bash работают.

monk ★★★★★
(30.09.25 15:55:20 MSK)

Ответ на: комментарий от Iron_Bug 30.09.25 13:48:32 MSK

не, ржавчина мне не нужна ни в каком виде

А почему нет? Общеизвестные причины мне известны, но может есть что-то ещё.

Мне самому не нравится повсеместное пихание раста, но дело же не только в языке, это прежде всего сложный интеллектуальный продукт.

kaldeon ★
(30.09.25 15:56:31 MSK)

Ответ на: комментарий от monk 30.09.25 15:55:20 MSK

В gtk работают, в vim работают, в bash работают.

Оно, как я понимаю, работает на открытие/изменение самого файла.

А когда вы попробуете это имя отдать в json-ое в каком нибудь REST-ответе?

eao197 ★★★★★
(30.09.25 16:00:26 MSK)

Ответ на: комментарий от eao197 30.09.25 16:00:26 MSK

А когда вы попробуете это имя отдать в json-ое в каком нибудь REST-ответе?

А ему не всё равно на поток байтов между кавычками?

А когда совсем не всё равно, недавно в 1С на грабли наступили: у них строки (и вообще все объекты) между клиентом и сервером передаются в XML. Всё было хорошо, пока Честный знак не придумал в штрихкоде разделителем ставить 0x1D, который запрещён в XML. Стали штрихкоды перед каждым серверным вызовом в base64 заворачивать…

monk ★★★★★
(30.09.25 16:20:46 MSK)

Ответ на: комментарий от monk 30.09.25 16:20:46 MSK

А ему не всё равно на поток байтов между кавычками?

Полагаю, что нет.

https://www.ietf.org/rfc/rfc4627.txt

3.  Encoding

   JSON text SHALL be encoded in Unicode.  The default encoding is
   UTF-8.

   Since the first two characters of a JSON text will always be ASCII
   characters [RFC0020], it is possible to determine whether an octet
   stream is UTF-8, UTF-16 (BE or LE), or UTF-32 (BE or LE) by looking
   at the pattern of nulls in the first four octets.

           00 00 00 xx  UTF-32BE
           00 xx 00 xx  UTF-16BE
           xx 00 00 00  UTF-32LE
           xx 00 xx 00  UTF-16LE
           xx xx xx xx  UTF-8

eao197 ★★★★★
(30.09.25 16:30:08 MSK)

Ответ на: комментарий от eao197 30.09.25 16:30:08 MSK

Прикольно, если не та кодировка, jq молча портит строку:

$ echo '{"тест": 0}' | iconv -t koi8-r | jq . | iconv -f koi8-r
{
  "О©╫О©╫О©╫О©╫": 0
}

monk ★★★★★
(30.09.25 16:52:08 MSK)
Последнее исправление: monk 30.09.25 16:52:13 MSK (всего исправлений: 1)

Ответ на: комментарий от monk 30.09.25 16:52:08 MSK

Прикольно, если не та кодировка, jq молча портит строку:

ЕМНИП, есть некое неформальное (а может и формальное?) соглашение о том, что если при декодировании UTF-8 встречается нелегальная для UTF-8 последовательность, то она заменяется каким-то специальным символом (правда его код я уже за давностью лет забыл).

eao197 ★★★★★
(30.09.25 17:17:14 MSK)

Ссылка

Ответ на: комментарий от kaldeon 30.09.25 15:56:31 MSK

я думаю, «общеизвестных» вполне хватает. моя позиция такова, что это поделка проприе-растов и копро-растов. несмотря на то, что они там это маскировали под «открытое и народное», но хрена лысого. это поделка конкретно Мозиллы и её ещё поддерживает Гугл. сделано с целью вытеснить открытые бесплатные реализации и насадить свои решения. как обычно у копрорастов. поводы для насаждения (якобы «безопасность» и фальшивое «удобство») высосаны из пальца. собственно говоря, эталонное ненужно. но в рекламу этого ненужно среди школотронов копрорасты ввалили довольно много денег.

Iron_Bug ★★★★★
(30.09.25 17:33:22 MSK)
Последнее исправление: Iron_Bug 30.09.25 17:35:04 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от necromant 30.09.25 02:21:36 MSK

а утилита html2text за какое количество времени справилась, не измеряли случаем?

Нет. Не измерял. Уже себя ограничиваю в этом маленьком проекте, хочется, конечно, еще померить и графики построить. Но пока ставлю на паузу.

lbvf50txt ★
(30.09.25 18:40:00 MSK)

Ссылка

Ответ на: комментарий от monk 30.09.25 16:20:46 MSK

Т.е. ваш генератор XML не умеет обеспечивать well-formed XML и заменять символы на entities? Уж не конкатенаций ли строк вы XML формируете?

Begemoth ★★★★★
(30.09.25 18:40:51 MSK)

Ответ на: комментарий от PolarFox 30.09.25 01:23:58 MSK

Если у сервера 32 ядра, то это около 32 запросов в секунду до того как скорость и этого запроса, и всего остального что происходит на этом сервере начнёт деградировать.

Многопоточность это интересная тема. Досконально разобраться как писать код который действительно ускоряет работу программы за счёт параллельного исполнения. Ведь надо, чтоб задача изолирована в памяти без обращения к внешним устройствам: сети или диску.

В Golang есть отдельный скедулер который может быстро перещелкивать горутины прикрепляя и открепляя их от треда ОС. Таким образом быстро перебираются корутины ожидающие ответа из сети. И сокращается время на скачивания данных из нескольких источников, так как этот процесс «запаралеливается», а цена переключения - минимальна.

Вот тут уже надо копать в глубь с буферам и интерфейсами. На каком этапе ОС сигнализирует корутине что пришли данные из сети? И так далее и тому подобное. Это уже достаточно низкий уровень, который не так часто нужен для проектирования конечных приложений.

Например, сайт codewars.com около 10 лет назад вообще работал на NodeJS c его Eventloop и без доступа к такому глубокому уровню детализации. Читал код запуска задачу на проверку в отдельном контейнере.

Так что так.

Concurrency is the computer science term for breaking up a single process into independent components and specifying how these components safely share data. (c) Jonathan Bodner

Learning Go An Idiomatic Approach to Real-World Go Programming

page 203. Chapter 10. Concurrency in Go

Канкаренси это термин из информатики описывающий разбиение процесса на независимые компоненты и определение безопасного разделения данных между ними. (с) Джонатан Боднер

Есть о чем порассуждать.

lbvf50txt ★
(30.09.25 18:52:32 MSK)
Последнее исправление: lbvf50txt 30.09.25 19:19:16 MSK (всего исправлений: 2)

Ответ на: комментарий от lbvf50txt 30.09.25 18:52:32 MSK

Ведь надо, чтоб задача изолирована в памяти без обращения к внешним устройствам: сети или диску.

Это только вершина айсберга. Довольно быстро вы поймёте что «драться» за локальную память тоже дорого, а в некоторых случаях - и за cachelines тоже, даже при отсутствии явных зависимостей.

bugfixer ★★★★★
(30.09.25 20:04:04 MSK)

Ссылка

Ответ на: комментарий от monk 30.09.25 14:49:59 MSK

Это index-only запрос, оптимизатор не должен читать таблицу вообще. Если индекс хранится в нужном порядке, то и индекс не будет читаться целиком.

x3al ★★★★★
(30.09.25 20:35:18 MSK)

Ответ на: комментарий от x3al 30.09.25 20:35:18 MSK

Это index-only запрос

Пойду проверю.

На первый взгляд вы тут не попадете в индексы, потому что строите их на timestamp поле, а выбираете distinct с приведением к типу ::date - вроде бы не должно так работать.

Toxo2 ★★★★★
(30.09.25 22:49:42 MSK)
Последнее исправление: Toxo2 30.09.25 23:00:19 MSK (всего исправлений: 1)

Ответ на: комментарий от Toxo2 30.09.25 22:49:42 MSK

От БД, возможно, зависит. Так-то в теории осуществимая операция.

PolarFox ★★★★★
(30.09.25 23:00:33 MSK)

Ответ на: комментарий от PolarFox 30.09.25 23:00:33 MSK

От БД, возможно, зависит.

Может и зависит.

В PostgreSQL 17.5 - тут Bitmap Index Scan со сканированием всех строк. Что вполне понятно.

Но может в каких-то других БД есть особая магия.

Toxo2 ★★★★★
(30.09.25 23:21:59 MSK)

Ссылка

Ответ на: комментарий от Toxo2 30.09.25 22:49:42 MSK

Если все поля в запросе есть в индексе (а в индекс можно включить в том числе и условия вроде WHERE message IS NOT NULL AND btrim(message) <> ''), то планировщик должен его использовать практически всегда если не считает, что в таблице буквально 3 строки и проще сделать full scan.

Можно сделать индекс по ::date.

DISTINCT применяется после индекса, поэтому не должен влиять.

x3al ★★★★★
(01.10.25 00:18:05 MSK)

Ответ на: комментарий от Begemoth 30.09.25 18:40:51 MSK

То не мой, то платформы 1С. Работает при вызовах типа:

&НаКлиенте
Процедура Пуск()
  Строка = "абв";
  ОбработатьНаСервере(Строка);
КонецПроцедуры

&НаСервере
Процедура ОбработатьНаСервере(Строка)
  // что-то сделать с данными на основе содержимого строки
КонецПроцедуры

И если есть в переменной Строка запрещённые символы, механизм ломается.

monk ★★★★★
(01.10.25 06:37:24 MSK)

Ответ на: комментарий от Begemoth 30.09.25 18:40:51 MSK

Контрольные символы в XML недопустимы даже в виде сущностей.

pasquale ★
(01.10.25 06:40:42 MSK)

Ссылка

Ответ на: комментарий от monk 01.10.25 06:37:24 MSK

«всё у 1с правильно»

похожу кодировка не есть свойство Строки поэтому нужно отдельно (на случай расхождения кодировок либо «всё у 1с правильно» разработчиков)

т.е. строку ууекать и сообщать какая кодировка с клиента уходит

- а вообще спасибо 1с за создание рынка труда вот такими «и в продакшен» решениями

https://en.wikipedia.org/wiki/Uuencoding

али экономить с

https://en.wikipedia.org/wiki/Ascii85

qulinxao3 ★☆
(01.10.25 06:40:44 MSK)
Последнее исправление: qulinxao3 01.10.25 06:47:03 MSK (всего исправлений: 2)

Ссылка

Ответ на: комментарий от x3al 01.10.25 00:18:05 MSK

DISTINCT применяется после индекса, поэтому не должен влиять.

Так до него неизвестно, сколько записей читать. Если без SQL, то читаем сортированные записи индекса отбирая даты, пока не наберётся N дат. А вот как это объяснить планировщику SQL, непонятно, он вроде как прочитает и обработает DISTINCT весь индекс, а только потом возьмёт нужные записи.

monk ★★★★★
(01.10.25 06:56:10 MSK)

Ответ на: комментарий от monk 01.10.25 06:56:10 MSK

если реально охота через sql получить линейную сложность - то стоит начать со специализации под конкретную субд - всяко можно (если это не mysql :)(старых версий) ) получить индекс наличных дат тогда по факту это обход шитого дерева до нужного лимита

qulinxao3 ★☆
(01.10.25 07:09:17 MSK)

Ответ на: комментарий от qulinxao3 01.10.25 07:09:17 MSK

то стоит начать со специализации под конкретную субд

Похоже, что при выборе использования СУБД, это необходимое решение.

monk ★★★★★
(01.10.25 07:23:08 MSK)

Ответ на: комментарий от monk 01.10.25 07:23:08 MSK

ну да
сам взлёт sql был именно обобщением(и отказом от самых хитровывернутых интерфейсов к данным) кучи разрозненых механизмов
а в «пту» с ног наголову - подают, что есть святой sql а всё остальное частности; отсюда же и orm как чистейший sql :)

qulinxao3 ★☆
(01.10.25 07:26:48 MSK)

Ответ на: комментарий от qulinxao3 01.10.25 07:26:48 MSK

:) https://postgrespro.ru/education/books

qulinxao3 ★☆
(01.10.25 07:54:07 MSK)

Ссылка

Ответ на: комментарий от x3al 30.09.25 20:35:18 MSK

Или вообще в аналитику по таблице глянет. А может, подвернётся удачная мат.вью и тогда - query_rewrite на неё. А может, в кэше найдётся. «Чудище огло, стозевно и лаял» :)

Paka_RD
(01.10.25 09:19:05 MSK)
Последнее исправление: Paka_RD 01.10.25 09:21:00 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от monk 01.10.25 06:56:10 MSK

Я понял о чем ты. Если очень хочется делать это в постгресе и гарантировать, что целый индекс читать не придется даже если в статистике мусор и планировщик вынужден делать план вслепую, то выбор, в общем, между:

Процедурой, которая буквально делает что ты хочешь. Процедуры в постгресе могут быть написаны на уйме языков (pl/pgsql это далеко не sql, например) и в них может быть любая логика. Читать поля из индекса в порядке, в котором индекс отсортирован, из курсора — дешево.
Либо заранее закинуть DISTINCT даты в отдельную таблицу чем-нибудь. Ну в смысле:
- Консистентно и со всеми ACID гарантиями: триггер
- Eventually consistent: LISTEN/NOTIFY.

x3al ★★★★★
(01.10.25 09:47:00 MSK)

Ответ на: комментарий от x3al 01.10.25 09:47:00 MSK

Благодарю! Да, так логично и не костыльно.

Кстати, может посоветуете, как практический вопрос решить: 1С генерирует запросы типа

SELECT TOP 40
  Details.F1,
  Details.F2,
...
FROM
  Details 
    JOIN Main
      ON Details.Name = Main.Name
      AND Details.Person = Main.Person
      AND Details.Id IN
        (SELECT TOP 1 Id FROM Details AS DetailsFilter
          WHERE 
            DetailsFilter.Person = Details.Person
            AND DetailsFilter.Name = Details.Person
            AND DetailsFilter.Begin <= &Date
            AND DetailsFilter.End >= &Date
         ORDER BY DetailsFilter.Begin Desc, DetailsFilter.Org)
    INNER JOIN Sec
      On Main.Person = Sec.Person AND Main.Org = Sec.Org
ORDER BY Sec.F3

Этот запрос работает быстро на MS SQL и очень медленно на PostgresPro (судя по всему, делает запрос по всей таблице по каждой строке таблицы Details).

Текст запроса и структуру базы менять нельзя (ORM, однако). Есть какие-то настройки, куда можно влезть? Пользователи уже смирились и познали дзен, но вдруг решение существует.

monk ★★★★★
(01.10.25 11:11:47 MSK)
Последнее исправление: monk 01.10.25 11:13:06 MSK (всего исправлений: 1)

Ответ на: комментарий от monk 01.10.25 11:11:47 MSK

кста есть вот этот талмуд(321 страница)

Флорес Структуры и управление данными (в девичестве Flores Data structure and management)

так там всё как «мы» любим сплошная реализация на железе - ваще огонь - ассемблер System/370

свои методы буферизации - чтение на уровне блоков ибо и файловая система лишняя абстракция

ну и алгосы этих вот структур управления данными огонь

будет быстрее ваших не SQL предложений ")

qulinxao3 ★☆
(02.10.25 15:41:48 MSK)
Последнее исправление: qulinxao3 02.10.25 15:42:05 MSK (всего исправлений: 1)

Ответ на: комментарий от monk 01.10.25 11:11:47 MSK

Пробовали вынести подзапрос в join? С джоинами всё предсказуемее.

kaldeon ★
(02.10.25 15:51:42 MSK)

Ответ на: комментарий от kaldeon 02.10.25 15:51:42 MSK

А разве можно сделать JOIN с SELECT TOP 1 ?

Суть проблемы в том, что нужна не вся Details, а TOP 40, но ORDER BY Sec.F3. MS SQL сортирует Sec по F3, берёт верхние записи, JOIN’ит по одной с тем крокодилом, что вверху и как набралось 40, прекращает. Postgres берёт весь Details, так как F3 в Details нет, а какие записи останутся после JOIN не очевидно. Details большой.

monk ★★★★★
(02.10.25 16:05:58 MSK)

Ответ на: комментарий от kaldeon 02.10.25 15:51:42 MSK

Ну и с учётом того, что сверху ORM, хотелось бы какой-то путь без правки запроса.

monk ★★★★★
(02.10.25 16:06:42 MSK)

Ссылка

Ответ на: комментарий от qulinxao3 02.10.25 15:41:48 MSK

С 1970-го наука всё-таки слегка продвинулась.

monk ★★★★★
(02.10.25 16:08:58 MSK)

Ссылка

Ответ на: комментарий от monk 02.10.25 16:05:58 MSK

Кажется, что можно сджойнить. Вместо top 1 джойним всё с top 40 и указываем там row_number, после чего фильтруем по row_number = 1.

Типовая задача — для каждого пользователя вернуть первый адрес. Джойним пользователей со всеми их адресами, каждому прописывая row_number() over (partition by user.id order by address) (для каждого пользователя свой инкремент, в порядке возрастания адреса), затем оставляем только rn=1.

Успех не обещаю, просто это общая рекомендация — использовать джойны вместо подзапросов. Может оно тоже плохо ляжет под общий алгоритм извлечения данных, может индекс не совпадёт. Но в общем случае так делают.

kaldeon ★
(02.10.25 16:46:54 MSK)
Последнее исправление: kaldeon 02.10.25 16:48:08 MSK (всего исправлений: 2)

Фигеть вы тут нафлудили

LINUX-ORG-RU ★★★★★
(02.10.25 16:52:21 MSK)

Ссылка

Ответ на: комментарий от kaldeon 02.10.25 16:46:54 MSK

Успех не обещаю, просто это общая рекомендация — использовать джойны вместо подзапросов.

Помогает, не спорю. Но переписывать половину чужой базы очень грустно. Надеялся, что есть какая-нибудь магическая настройка или расширение.

monk ★★★★★
(02.10.25 19:27:43 MSK)

Ссылка

Ответ на: комментарий от Iron_Bug 24.09.25 16:38:40 MSK

не, христианство меня не интересует. причём не интересует прямо с большой буквы. я его не переношу на дух. оно столько вреда нанесло культуре и науке древнего мира

От куда информация о вреде? Я как раз таки скажу, что христианство (а именно католичество) способостовало разивитию того, что мы сегодня видим как соблюдение прав человека, наука, вообще высшее образование.

Ivan_S
(03.10.25 10:00:49 MSK)

Ответ на: комментарий от Ivan_S 03.10.25 10:00:49 MSK

прав человека? да вы смеётесь! это инквизиция-то способствовала правам человека? ну-ну.

я не буду здесь развивать эту тему. посты потрут. читайте литературу и просвещайтесь. одни крестовые походы и инквизиция уничтожили больше науки, искусства и культуры, талантливых и умных людей, чем всё остальное, вместе взятое. это вкратце. вообще, график развития науки, разных открытий и достижений просто просел на несколько столетий, и очень значительно. это результат насаждения христианства. если бы его не было, цивилизация была бы намного более развитой.

Iron_Bug ★★★★★
(03.10.25 16:06:57 MSK)

Ответ на: комментарий от Iron_Bug 03.10.25 16:06:57 MSK

одни крестовые походы и инквизиция уничтожили больше науки, искусства и культуры, талантливых и умных людей, чем всё остальное, вместе взятое

Если сравнивать за один период христианскую Европу и нехристианские Индию и Китай, то Европе всё-таки удалось убедительно опередить конкурентов. Считаете, что это не благодаря христианству, а «несмотря на»?

да вы смеётесь! это инквизиция-то способствовала правам человека? ну-ну.

Как бы да. В виде формализации суда, например. Опять же, можно сравнить с правами человека в доколониальных Индии и Китае.

monk ★★★★★
(03.10.25 17:46:57 MSK)

Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)

← 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 →

←	Каких авторов стоит смотреть по с++ на Ютубе?

Development

html canvas, линии, координаты, пиксельные буферы, OffscreenCanvas и прочее безумие.

→

Похожие темы