Какие есть живые opensource проекты где экономят наносекунды в юзерспейсе?

DPDK

drsm ★★
(18.09.18 02:19:26 MSK)

Ссылка

Толсто.

anonymous
(18.09.18 08:41:43 MSK)

Ссылка

все, которые написаны не на питоне? а, нет, тут речь не о минутах.

anonymous
(18.09.18 09:19:15 MSK)

любые, где не экономят ОЗУ, то есть, 99,9% проектов.

~~darkenshvein~~ ★★★★★
(18.09.18 09:20:52 MSK)

Ссылка

Ответ на: комментарий от anonymous 18.09.18 09:19:15 MSK

Мощность современных процессров позволяет писать на интерпретируемом и не думать об этом. А тяжёлые задачи (те что на минуты/часы) менее тяжёлыми от переписывания на си не станут, экономия будет маргинальной.

anonymous
(18.09.18 09:24:22 MSK)

Ответ на: комментарий от anonymous 18.09.18 09:24:22 MSK

Мощность современных процессров позволяет писать на интерпретируемом и не думать об этом.

типичное заблуждение человека, не привыкшего мыслить алгоритмически.

сколько данных на единицу времени способен переварить твой костыль? в 10-40 раз меньше, чем аналог на С/С++? а в чем плюсы такого подхода для бизнеса? в том, что нужно тратить в 10-40 раз больше средств на железо? а зарплата у средней веб-мартышки сильно меньше, чем у крестовика? зачем ты нужен вообще, в чем твоя польза?

anonymous
(18.09.18 10:01:32 MSK)

Ответ на: комментарий от anonymous 18.09.18 10:01:32 MSK

Решение далеко не всех задач упирается в эффективность байтоёбства. При этом стоимость разработки растёт экспоненциально, как и время на неё необходимое. И это мы ещё не считали трудность нахождения нормальных кадров (и их стоимость).

anonymous
(18.09.18 10:05:43 MSK)

Ссылка

Ответ на: комментарий от anonymous 18.09.18 10:01:32 MSK

Увы, встречаются такие дегенераты, которые считают пхытончик и прочую маргинальщину не хуже нормальных ЯП. А нормальных ЯП немного. Точнее, он один - С!

anonymous
(18.09.18 10:08:04 MSK)

Ответ на: комментарий от anonymous 18.09.18 10:01:32 MSK

будущее за энергоэффективными маломощными и полностью автономными девайсами. в таком мире нет места медленному коду. и уж тем более ему не место на вычислительных кластерах. а бизнес логику, не требующую сверх скоростей, писать одинаково просто на любом языке

anonymous
(18.09.18 10:19:26 MSK)

Ссылка

Какие ЯП ты подразумеваешь? На каком языке можно экономить наносекунды да еще и юзерспейс писать? А главное для чего?

Deleted
(18.09.18 10:24:16 MSK)

Ffmpeg и mesa первыми приходят на ум.

morse ★★★★★
(18.09.18 10:25:53 MSK)

Ответ на: комментарий от morse 18.09.18 10:25:53 MSK

Где там экономят наносекунды?

Deleted
(18.09.18 10:28:02 MSK)

Ссылка

Есть 3 вида оптимизации: do less, do less often, do faster.

Самый большой навар с первого, но всё почему-то заморачиваться последним.

beastie ★★★★★
(18.09.18 10:36:14 MSK)

hft фремворки на гитлабе полно

anonymous
(18.09.18 10:39:03 MSK)

Смотри проекты suckless.org

anonymous
(18.09.18 11:01:53 MSK)

Ответ на: комментарий от Deleted 18.09.18 10:24:16 MSK

Ну например те же sbe парсеры считают, правда сотни наносекунд, ну всё что до десятков us - наверное пойдёт.

~~onhydro~~
(18.09.18 11:10:05 MSK) автор топика

Ссылка

Ответ на: комментарий от anonymous 18.09.18 10:39:03 MSK

Можно ссылку на один, что бы ключевые слова для поиска понять?

~~onhydro~~
(18.09.18 11:10:43 MSK) автор топика

Ссылка

Ответ на: комментарий от beastie 18.09.18 10:36:14 MSK

Не везде можно do less. Есть совершенно деревянные области, в основном всякие шлюзы под 50G железо, кирнел бипасы, вычисления на gpu(тут уже спорно) и т.п. Вопрос, чего из этого живьём в опенсурсе есть, кроме dpdk и pf_ring.

~~onhydro~~
(18.09.18 11:13:29 MSK) автор топика

Ответ на: комментарий от anonymous 18.09.18 11:01:53 MSK

Сразу после ссылок на бенчмарки, где эти самые наносекунды кто-то, зачем то, считает на фоне ui i/o и дефолтного планировщика.

~~onhydro~~
(18.09.18 11:14:39 MSK) автор топика

Ссылка

Ответ на: комментарий от morse 18.09.18 10:25:53 MSK

О! Кодеки же, точно, спасибо :)

~~onhydro~~
(18.09.18 11:20:45 MSK) автор топика

Ссылка

Ответ на: комментарий от onhydro 18.09.18 11:13:29 MSK

кирнел бипасы

Что это?

tailgunner ★★★★★
(18.09.18 11:32:00 MSK)

Ответ на: комментарий от tailgunner 18.09.18 11:32:00 MSK

Это и всякие корутины с планировщиками в юзерспейсе, которыми яндексоиды на каждой конфе нудят.

~~onhydro~~
(18.09.18 11:34:43 MSK) автор топика

Ответ на: комментарий от onhydro 18.09.18 11:13:29 MSK

кроме dpdk и pf_ring

https://github.com/luigirizzo/netmap

Deleted
(18.09.18 11:35:17 MSK)

Ответ на: комментарий от onhydro 18.09.18 11:34:43 MSK

Эти слова читаются «кернел байпасс».

tailgunner ★★★★★
(18.09.18 11:35:26 MSK)

Ответ на: комментарий от tailgunner 18.09.18 11:35:26 MSK

Май инглиш из вери и бед.

~~onhydro~~
(18.09.18 11:36:12 MSK) автор топика

Ссылка

Ответ на: комментарий от Deleted 18.09.18 11:35:17 MSK

А ты участник или сочувствующий? Есть у них какие то бенчмарки и инструкции по профилированию?

~~onhydro~~
(18.09.18 11:45:41 MSK) автор топика

Кстати, компиляторы (C, C++)

KennyMinigun ★★★★★
(18.09.18 11:50:57 MSK)
Последнее исправление: KennyMinigun 18.09.18 11:51:13 MSK (всего исправлений: 1)

Ответ на: комментарий от KennyMinigun 18.09.18 11:50:57 MSK

А точно? Там вроде всё в дисковое i/o упирается и пока ждёшь на чём то в духе select, по идее можно кучу дел провернуть?

~~onhydro~~
(18.09.18 12:08:09 MSK) автор топика

Ответ на: комментарий от onhydro 18.09.18 12:08:09 MSK

Ты головой не ударился? При компиляции диска никто не ждёт, особенно если проект большой. Ну нет, я понимаю, что какой - нибудь ойдевять будет ждать диска на 5400 рпм. Но в остальном всё совсем не так.

Deleted
(18.09.18 12:15:57 MSK)

Ответ на: комментарий от Deleted 18.09.18 12:15:57 MSK

Если в один поток, то наверное, а если это не конпиляние в вакууме, то почему-то рамдиск даёт прирост в скорости сборки до 50%. Хотя, возможно тут дело скорее в линковщике.

В любом случае, было бы интересно на бенчмарки посмотреть, если они есть конечно.

~~onhydro~~
(18.09.18 12:20:35 MSK) автор топика

ffmpeg должен экономить по идее.

crutch_master ★★★★★
(18.09.18 12:21:22 MSK)

Ответ на: комментарий от onhydro 18.09.18 12:20:35 MSK

Я в своей Gentoo не вижу вообще причин использовать RAM-диск. Может потому, что я использую pipe? Основная проблема возникает при линковке, и на время компиляции (в случае с особенно большими проектами) ну не то, чтобы сильно влияет. Хотя нет. Наверное, всё же зависит от компилируемого софта и мощности тех или иных компонентов в компиляющей тачке?

на бенчмарки посмотреть

Как ты себе представляешь? У кого-то атом с ССД, у кого-то гиперпень ещё на древнем IDE, у кого-то двухпроцессорный сервер на Xeon E5, кто-то вообще сидит на EPYC с NVMe...

Deleted
(18.09.18 12:27:01 MSK)

Ответ на: комментарий от Deleted 18.09.18 12:27:01 MSK

Какая разница, смотришь результат A на заданном освобождённом ядре, профилируешь, оптимизируешь, смотришь результат B. Для этой железки стало лучше? Стало - коммитишь, дальше на CI или в ручную на референсном железе проверяются результаты и билд либо проходит либо нет.

Ну это в идеальном мире, который не факт что может себе позволить средней руки опенсурс.

~~onhydro~~
(18.09.18 12:31:21 MSK) автор топика

Ответ на: комментарий от crutch_master 18.09.18 12:21:22 MSK

А что они делают? Так можно и мезу назвать. Тем более что у ффмпег практически ничего своего и нет. Видимо, жирнолис очень экономит. Да вообще все, только требования то могут отличаться на порядки. Обычно экономят путём оптимизаций узких мест на горячем коде, по-моему оп спрашивает где пытаются всё делать в кернелспейсе. Очевидно это сразу не про линукс, части которого были в юзерспейсе, да и не про бзди с их интерпретаторами в ядре.

anonymous
(18.09.18 12:31:49 MSK)

Ответ на: комментарий от anonymous 18.09.18 12:31:49 MSK

А что они делают?

Кодируют/декодируют видео. Там большая нагрузка на проц => всякий дикий изврат + асм вставки.

crutch_master ★★★★★
(18.09.18 12:33:52 MSK)

Ссылка

Ответ на: комментарий от onhydro 18.09.18 12:31:21 MSK

Для этой железки стало лучше? Стало - коммитишь, дальше на CI или в ручную на референсном железе проверяются результаты и билд либо проходит либо нет.

Учи матчасть. Под конкретную железку оптимизирует компилятор, а не твои кривые руки и ассемблерные вставки. Твоя задача - оптимизация алгоритмов, т.е. do less. Если ты где-то пишешь приложение под конкретную железку - тут можешь, конечно, взяться за асм и не доверять компилятору. В остальных случаях вся оптимизация под железо - уменьшение размера машинного кода и оптимизация алгоритмов, другого как бы и нет.

Deleted
(18.09.18 12:34:51 MSK)

Ответ на: комментарий от anonymous 18.09.18 12:31:49 MSK

Я как раз спрашиваю про юзерспейс, о чём и написал в заголовке топика :)

~~onhydro~~
(18.09.18 12:35:03 MSK) автор топика

Ссылка

Ответ на: комментарий от anonymous 18.09.18 12:31:49 MSK

ОП спрашивает вообще какую-то дичь.

Deleted
(18.09.18 12:35:43 MSK)

Ссылка

Я бы сказал это относится скорее не к проекту, а разработчику. Умеет - улучшает понемногу. Будь то bash, GCC, GHC или ядро.

anonymous
(18.09.18 12:38:05 MSK)

Ссылка

Ответ на: комментарий от Deleted 18.09.18 12:34:51 MSK

Да да, особенно это относится к коду общего назначения, где просто так даже avx не заюзаешь, что бы ретроградов не обидеть которые сидят на чём-то окромя генты.

Если ты имеешь относительный прирост на одной x86 машине, то есть немалая вероятность, что ты получишь такой же или лучше прирост на другой. Я и не говорил про оптимизацию под конкретную железку, только про то, что перед принятием кода в мастер надо прогнать бенчмарки на референсном железе что бы не было регрессии уровня у автора патча стало быстрее, зато в 99% типовых случаев стало медленнее.

~~onhydro~~
(18.09.18 12:39:15 MSK) автор топика

Ответ на: комментарий от onhydro 18.09.18 12:39:15 MSK

Хорошо. Оптимизировал ты свой софт под i686. Что дальше?
Либо занимаешься дистрибуцией _разных_ бинарников под _разные_ архитектуры (я щас тока про x86) либо забиваешь на это. Максимум ты можешь затребовать наличие каких-то инструкций у процессоров и отсечь остальные. А всякие задроты с гентой и слакой соберут софт сами так, как им надо.

Deleted
(18.09.18 12:41:48 MSK)

Ответ на: комментарий от Deleted 18.09.18 12:41:48 MSK

Ты придумал какую то свою мысль, и не хочешь читать чего тебе пишут в ответ, хочешь писать свою мысль про оптимизацию под конкретное железо.

~~onhydro~~
(18.09.18 12:42:28 MSK) автор топика

Ответ на: комментарий от onhydro 18.09.18 12:39:15 MSK

или лучше

или хуже, хехе

avx не заюзаешь

делаешь костылей для ретроградов и шаришь различные билды, делов то. Все так поступают. Ну или в рантайме с dlopen.

anonymous
(18.09.18 12:43:31 MSK)

Ответ на: комментарий от onhydro 18.09.18 12:42:28 MSK

Хорошо. Как ты будешь наносекунды в моем юзерспейсе экономить? Кроме как do less? В чём вопрос то? Примеры оптимизации do less? Так это исключительно эффективность алгоритма и в некоторых случаях «умность» компилятора. Т.е. вопрос вообще как бы странен сам по себе. Тебе нужны максимально эффективные вариации алгоритмов? Каких алгоритмов?

Deleted
(18.09.18 12:44:53 MSK)

Ответ на: комментарий от anonymous 18.09.18 12:43:31 MSK

Кто же спорит, что можно. Беседа о том, что если горячей оказалась ассемблерная вставка это всё равно не показатель, что переписать надо конкретно этот код, как и, что там нужно так низко пасть.

~~onhydro~~
(18.09.18 12:48:18 MSK) автор топика

Ответ на: комментарий от Deleted 18.09.18 12:44:53 MSK

Мне нужно ПО в котором необходимы оптимизации указанного уровня т.к. это напрямую повышает качество этого ПО, требуемое пользователем. Т.е. чем быстрее отработал горячий участок кода в юзерспейсе, тем лучше работает ПО. I/O с лэйтенси выше десятков us понятно идёт лесом. Люди которые поняли о чём я - накидали вариантов, похожих на правду. Почему компилятор похож на правду - потому что, там i/o в памяти происходит. Почему dpdk и иже с ними подходит - потому то их используют с 10G+ железками, в том числе и с IB, там порядка 1-10us лейтенси на пакет притом в 99.5% случаев. Почему подходят mesa и ffmpeg надо ещё понять, но по идее должны подходить по той же причине, что и компиляторы.

А тебе видимо хочется просто подискутировать но ты не в теме, поэтому пытаешься загнать какую то свою тему :)

~~onhydro~~
(18.09.18 12:57:37 MSK) автор топика

Ответ на: комментарий от onhydro 18.09.18 12:57:37 MSK

Т.е. чем быстрее отработал горячий участок кода в юзерспейсе, тем лучше работает ПО.

Что-то я не могу вспомнить ничего кроме hiload решений которым такое требуется. Можешь хоть намекнуть что за софт.

timdorohin ★★★★
(18.09.18 13:03:32 MSK)

Ответ на: комментарий от onhydro 18.09.18 12:48:18 MSK

Если не этот код, то у тебя остаются do less often и do less. По-моему тебя в оп в кучу проекты экономящие переключения контекста и сбросы кешей и те, что утилизируют алгоритмические хаки (платформозависимые как правило). Возможно ты ищешь LWKT — это как раз про экономию времени. И кажется в оп у тебя костылики для NPTL и попытки решать проблемы зелёными тредами — в таком случае сюда же можно и icedtea.

anonymous
(18.09.18 13:04:02 MSK)

Ответ на: комментарий от anonymous 18.09.18 10:08:04 MSK

Э-dick опять бояры перебрал …

~~redgremlin~~ ★★★★★
(18.09.18 13:07:01 MSK)

Ссылка

Ответ на: комментарий от timdorohin 18.09.18 13:03:32 MSK

Ну я наблюдал такие упражнения в парсерах бинарных протоколов типа FAST или SBE, да хотя бы тот же protobuf.

~~onhydro~~
(18.09.18 13:07:12 MSK) автор топика

Ссылка

Похожие темы