Изобрёл алгоритм защиты от флуда. Покритикуйте.

Велосипед скорее всего.

Алгоритм повышения стоимости операций для клиента с сохранением низкой стоимости для сервера.

Пример где это нужно: хочется зарегать учётную запись без sms, email и т.п., но надо избежать флуда регистраций.

В начале процедуры регистрации генерим на сервере 64КБ рандома.
Запоминаем 8 случайных кусков по 8 байт из этих 64кб рандома и смещения до них.
Отправляем юзеру данные 64кб и забываем эти 64 кб.
Далее с интервалом в секунду посылаем юзеру запросы «дай 8 байт со смещения N», где очередное N - какое-то из запомненных нами на шаге (2).
Юзер не знает что мы запомнили на шаге (2) и, таким образом, что сервер может спросить и вынужден хранить всё.
Серверу нужно хранить только 8*8 байт.
«с интервалом в секунду» - чтобы инициатива о длительности процедуры была полностью в руках сервера. Если клиент ответил раньше - отпинываем его совсем.

Смысл в том, что если клиент захочет запустить много-много параллельных процессов, то это будет стоить ему в разы больше памяти, чем серверу.

Хочется узнать:

Как называется велосипед, который я только что изобрёл, у нормальных людей.
Что можно улучшить.
Альтернативы этому подходу.

Ссылка

← Как правильно разделить 2 типа сборки в Makefile

Использование BC в Bash →

← 1 2 3 →

Ответ на: комментарий от SZT 04.02.20 11:37:14 MSK

А как проверить, что свернули достаточно хорошо, а не просто сдвинули координаты атомов внутрь некой сферы? Нужно ведь убедиться, что результат получился в результате проведения расчётов по заданным правилам. Иначе смысла в результате нет.

i-rinat ★★★★★
(04.02.20 14:39:27 MSK)

Ответ на: комментарий от Harald 04.02.20 03:50:45 MSK

Ненастоящий рандом можно предсказать

предскажы :D

var iv = [Math.random(), Math.random(), Math.random()];
var a = 4;
var x = iv[0];
var xn = () => x = a * x * (1 - x);
var seq = Array(30).fill().map(xn);
var secret = [iv, seq[Math.trunc(iv[1] * seq.length)], seq[Math.trunc(iv[1] * seq.length)]]

console.log('lob:', seq);
console.log('q1', Math.trunc(iv[1] * seq.length));
console.log('q2', Math.trunc(iv[2] * seq.length));

drsm ★★
(04.02.20 15:03:42 MSK)
Последнее исправление: drsm 04.02.20 15:05:11 MSK (всего исправлений: 1)

Ссылка

Ты изобрел Proof-of-Storage (иногда Proof-of-Space), поищи. В блокчейнах несколько раз пытались в такое. Может что можно применить для задачи.

Proof-of-Work уже пытались применять против спама, сам Hashcash был собственно и предложен против спама еще в 1999, но оказался плохо применим по прямому назначению, так как спамеру легче иметь оборудование или ботнеты для атаки достаточной производительности, чтобы привести сложность для пользователя от некомфортной до непосильной.

Proof-of-Storage должен быть лучше, странно что при этом никто особо не пытался его так применять. Но проблема все равно остается: можно иметь ботнет с большим количеством места или арендовать на короткое время. В общем случае нужно учитывать, что у атакующего будет ресурса на порядки больше, чем у пользователя.

anonymous
(04.02.20 16:22:57 MSK)

В начале процедуры регистрации генерим на сервере 64КБ рандома.

А что не 64 гигабайта? А то сейчас у каждого по 32 гигабайта памяти в компьютере, это 500000 параллельных регистраций!

~~hateyoufeel~~ ★★★★★
(04.02.20 18:38:36 MSK)

Ссылка

Раз ты так ненавидишь своих пользователей, используй блокчейн! Нужно чтобы пользователи майнили токены ради регистрации. Кто успешно смайнит новый блок, получает аккаунт. Сложность только сразу выставь по максимуму.

~~hateyoufeel~~ ★★★★★
(04.02.20 18:45:35 MSK)

Ссылка

Давай с простого начнём. Кто в твоём случае «пользователь»? Конкретное ip соединение? ip адрес? Браузер с кукой? Как ты будешь идентифицировать состояние?

ioway ☆
(04.02.20 18:51:34 MSK)

Ответ на: комментарий от anonymous 04.02.20 16:22:57 MSK

В общем случае нужно учитывать, что у атакующего будет ресурса на порядки больше, чем у пользователя.

Хозяину атакуемого ресурса похрен. Тот факт, что атакующий вынужден тратить в разы больше бабла на атаки, чем хозяин ресурса - греет душу и успокаивает. Даже при том, что ресурс лежит. Если ресурс должен жить, то хозяину ресурса нужно будет влить меньше бабла, чем атакующему, чтобы вернуть ситуацию в нормальное состояние.

~~igloev~~
(04.02.20 19:06:55 MSK) автор топика

Ответ на: комментарий от ioway 04.02.20 18:51:34 MSK

Давай с простого начнём. Кто в твоём случае «пользователь»? Конкретное ip соединение? ip адрес? Браузер с кукой? Как ты будешь идентифицировать состояние?

Не, надо со сложного. С простого уже я сам начал.

~~igloev~~
(04.02.20 19:08:07 MSK) автор топика

Ссылка

Ответ на: комментарий от igloev 04.02.20 19:06:55 MSK

А на пользователей плевать, да? Тогда просто выключи свой ресурс. Эффект будет тот же, а усилий уйдёт намного меньше.

i-rinat ★★★★★
(04.02.20 19:11:03 MSK)

Ответ на: комментарий от i-rinat 04.02.20 19:11:03 MSK

А на пользователей плевать, да?

На добросовестных пользователей с одним конекшеном не плевать и у них всё будет нормально. Та же капча — гораздо более иезуитское издевательство.

vodz ★★★★★
(04.02.20 19:30:18 MSK)

Ссылка

ночью посмотрю.

Deleted
(04.02.20 20:03:29 MSK)

Ссылка

Ответ на: комментарий от i-rinat 04.02.20 19:11:03 MSK

А на пользователей плевать, да? Тогда просто выключи свой ресурс. Эффект будет тот же, а усилий уйдёт намного меньше.

У меня нет сразу миллиона долларов на сервера, при чём тут плевать. Просто если мне виртуалка стоит в месяц 400 руб, а атакующему 4000 руб - я радуюсь. Пользователям не повезло одинаково в любом сценарии - я как был нищебродом так и остался.

~~igloev~~
(04.02.20 21:07:59 MSK) автор топика

Ссылка

Ответ на: комментарий от Nervous 04.02.20 00:39:16 MSK

Нет. Издевательство над юзерами, это номер мобильного телефона.

peregrine ★★★★★
(04.02.20 21:12:05 MSK)

Ссылка

Ответ на: комментарий от igloev 04.02.20 01:39:17 MSK

Тем что лучше каптчу гадать, чем смотреть на прогрессбар. Если сайт открывается дольше 2 секунд, я иду на следующий в выборке гугла

peregrine ★★★★★
(04.02.20 21:13:37 MSK)

Ответ на: комментарий от KillTheCat 04.02.20 03:57:29 MSK

А чем больше плюсов, тем больше крипты автору поста от плюсанувших и сделать свою крипту, кто хочет, пусть генерит как проклятый?

peregrine ★★★★★
(04.02.20 21:17:12 MSK)

Ответ на: комментарий от torvn77 04.02.20 05:38:08 MSK

А ты на майни биткоинов. Слишком дорого майнить по ресурсам, чтобы просто флудить.

peregrine ★★★★★
(04.02.20 21:17:57 MSK)

Ответ на: комментарий от Deleted 04.02.20 03:51:59 MSK

jpeg у вас статический и будет в кеше. А 64К рандома нужно генерировать, т.е. выделить память, записать в память, отдать клиенту, отследить конец передачи и освободить. Это выйдет в ~10 раз дороже, т.е. у вас первые шаги дороже для сервера, и растет эта стоимость с обоих сторон одинаково и линейно.

На всякий уточню, что «~10 раз» имелось в виду в нагруженном сценарии, с usermode TCP-стеком и полным off-load непосредственно через DMA-ring.

Deleted
(04.02.20 21:35:11 MSK)

Ссылка

Ответ на: комментарий от i-rinat 04.02.20 14:39:27 MSK

В качестве ответа можно выдавать непосредственно сам способ сворачивания, а не ответ в виде правильной структуры.

Попробую привести сложную аналогию. Допустим если бы задача была «показать в физической симуляции некий способ, которым можно открыть замок, используя отмычки», показывать надо было б не то, как отмычки внезапно телепортируются внутрь механизма и что-то там перещелкивают, а надо показать сам процесс пошагово, как они из исходной позиции входят в замочную скважину, толкают кодовые штифты и потом проворачивают сам механизм. И можно валидировать сам процесс, т.е. проверить что отмычки не проходят сквозь стенки замка, что они не перемещаются со сверхвысокой скоростью и так далее, т.е. что процесс симуляции открытия замка соответствует неким критериям. Так вот, просимулировать готовую последовательность действий для взлома замка и проверить его корректность намного проще, чем осуществлять взлом с нуля путем перебора кучи способов или еще как-то.

SZT ★★★★★
(04.02.20 21:38:49 MSK)
Последнее исправление: SZT 04.02.20 21:40:59 MSK (всего исправлений: 1)

Ссылка

Покритикуйте

Говно.

anonymous
(04.02.20 21:42:47 MSK)

Ссылка

Смысл в том, что если клиент захочет запустить много-много параллельных процессов, то это будет стоить ему в разы больше памяти, чем серверу.

Что мешает эти 64КБ или больше хранить на SSD/HDD?

V1KT0P ★★
(04.02.20 21:43:21 MSK)

Ссылка

Ответ на: комментарий от anonymous 04.02.20 00:36:28 MSK

Каптча

Ничего тупее и омерзительней капчи просто нет. Давай, зайди с мобильного фаерфокса через тор на лор и напости тут. А потом повтори что ты там чем-то типа капчи восхищался.

И не надо втирать, что это извращенский способ. Это просто яркий пример. Если хочешь принудить к чему-то своих пользователей, например, вместе с самим собой окунаться в известную субстанцию – капча отличный выбор.

anonymous
(04.02.20 21:49:38 MSK)

Ссылка

Ответ на: комментарий от torvn77 04.02.20 11:57:12 MSK

И я почти всегда считал зелёных врагами общества и вредителями и как вижу незря, сейчам вот они оказывается интересы ботнетной мафии защищали, и в твоём лице продолжают их защищать.

Ты зря наехал на зелёных. Не в курсе что ли, что они с ботнетной мафией объеденились. Даже Анонимус на них не рыпается. Ведь они (мы) запросто могут задудосить твою мамку.

anonymous
(04.02.20 22:03:42 MSK)

Ссылка

Гораздо проще заставлять пользователей при регистрации покупать акции твоей крмпайки-сайта. Это решает все вопросы, кроме притока пользователей на начальном этапе. Эй-ки-эй МММ продуксион.

anonymous
(04.02.20 22:14:43 MSK)

Ссылка

Смысл в том, что если клиент захочет запустить много-много параллельных процессов, то это будет стоить ему в разы больше памяти, чем серверу.

Каменты почитал, и вот что я хочу ~~спросить~~ сказать. Если задача – не давать клиенту слишком часто пинать сервер, то проще держать массив таймстампов последнего пинка, индексы – TCP-порты соединений. Максимальное количество одновременных TCP-соединений – 64к (в реале обычно гораздо меньше); по 4 байта на таймстамп – с головой, скорее всего и в 2 байта можно уложиться (два ограничителя: точность допустим 0.1s; плюс давность: таймстампы часовой давности точно не нужны). Итого 128 килобайт (опять же, в реале обычно гораздо меньше) и никаких вычислений ни на сервере, ни на клиенте.

dimgel ★★★★★
(05.02.20 00:57:41 MSK)

Ответ на: комментарий от dimgel 05.02.20 00:57:41 MSK

Максимальное количество одновременных TCP-соединений – 64к (в реале обычно гораздо меньше)

на самом деле больше

Harald ★★★★★
(05.02.20 00:59:41 MSK)

Почитал я тред и мне вот такая идея пришла в голову.

Скажем, у нас сервер рассчитан на 100 одновременных пользователей.

При достижении 90 пользователей, мы каждому следующему даем экспонентно более сложную задачку для решения.

Всё уже придумано до нас?

tyakos ★★★
(05.02.20 01:23:04 MSK)

Ответ на: комментарий от peregrine 04.02.20 21:17:57 MSK

Зачем майнить биткоин если его можно просто купить?

torvn77 ★★★★★
(05.02.20 02:25:26 MSK)

Ссылка

Чувак, ты не о том ресурсе подумал. Надо было не о CPU/RAM думать, а о времени. Просто не давать флудить юзеру, заставляя его ждать какое-то время, пусть 0.3 секунды, а если ты не хочешь чтобы регались боты миллионами, то разрешай не более 5 регистраций с подсети в час. Ну, и каптчу можно весёлую сделать, а не это унылое г от гугля. Например, стереть мышкой на канвасе красный круг, не трогая фиолетовый квадрат. Даже такая простая каптча отвернёт кучу ботов, 99%

menangen ★★★★★
(05.02.20 06:41:48 MSK)

Ответ на: комментарий от Harald 05.02.20 00:59:41 MSK

Это каким же чудом? Номер порта в TCP-пакете 16-битный. Хм, разве что если слушать сразу несколько интерфейсов…

dimgel ★★★★★
(05.02.20 08:54:07 MSK)

Ответ на: комментарий от menangen 05.02.20 06:41:48 MSK

не надо юзать ip/подсеть как идентификатор

MaZy ★★★★★
(05.02.20 09:05:44 MSK)

Ссылка

Ответ на: комментарий от dimgel 05.02.20 08:54:07 MSK

соединение идентифицируется не одним портом, а вектором (адрес источника, порт источника, адрес назначения, порт назначения)

Harald ★★★★★
(05.02.20 15:15:06 MSK)

Ответ на: комментарий от menangen 05.02.20 06:41:48 MSK

Чувак, ты не о том ресурсе подумал. Надо было не о CPU/RAM думать, а о времени. Просто не давать флудить юзеру, заставляя его ждать какое-то время, пусть 0.3 секунды, а если ты не хочешь чтобы регались боты миллионами, то разрешай не более 5 регистраций с подсети в час. Ну, и каптчу можно весёлую сделать, а не это унылое г от гугля. Например, стереть мышкой на канвасе красный круг, не трогая фиолетовый квадрат. Даже такая простая каптча отвернёт кучу ботов, 99%

Спасибо, конструктивно.

«Не давать флудить» - это заложено в изначальное описание. Я ведь описывал некую систему шагов, которая заставляет юзерский JS обменяться с сервером какими-то 8 пакетами по 1 штуке в секунду. Для юзера это будет выглядеть как не очень долгий прогрессбар, а сервер будет отбивать попытки провести этот процесс быстрее.

~~igloev~~
(05.02.20 15:50:34 MSK) автор топика

Ссылка

Ответ на: комментарий от tyakos 05.02.20 01:23:04 MSK

Скажем, у нас сервер рассчитан на 100 одновременных пользователей.

Не нужно такое органичение.

~~igloev~~
(05.02.20 15:52:58 MSK) автор топика

Ссылка

Ответ на: комментарий от peregrine 04.02.20 21:13:37 MSK

Тем что лучше каптчу гадать, чем смотреть на прогрессбар. Если сайт открывается дольше 2 секунд, я иду на следующий в выборке гугла

Ты жопой читал. Речь не про «открывается», а про «регистрация». Регистрация всегда дольше 2 секунд на любом сцайте.

~~igloev~~
(05.02.20 16:03:31 MSK) автор топика

Ссылка

Пример где это нужно: хочется зарегать учётную запись без sms, email и т.п., но надо избежать флуда регистраций.

Может для тех кто только зарегистрировался просто ставить ограничения пока не докажут свою человечность?

Например новая тема от такого пользователя видна только админу и модераторам и помечается меткой и если кто из модеров подтвердит то тема становится видна и пользователь получает «очки человечности».

Плюс еще можно добавить эвристики на тему спама ведь там явно либо ссылку будут пытаться пропихнуть либо ключевые слова либо эти-же слова но для обхода будут пытаться заменять их похожими символами что легко определяется. А если просто мусором хотят завалить то так-же можно придумать какую-то эвристику основанную на грамматике языка типа куча подряд глаголов или существительных которые явно не имеют смысл и т.д.

V1KT0P ★★
(05.02.20 16:25:03 MSK)

Ответ на: комментарий от Harald 05.02.20 15:15:06 MSK

Для расчёта количества обслуживаемых портов, remote адреса-порты нерелевантны. А про локальный адрес я уже догадался.

dimgel ★★★★★
(05.02.20 16:37:18 MSK)

Ответ на: комментарий от dimgel 05.02.20 16:37:18 MSK

https://stackoverflow.com/questions/2332741/what-is-the-theoretical-maximum-n...

TL;DR 2^64 c одного локального адреса

Harald ★★★★★
(05.02.20 17:01:46 MSK)

Ответ на: комментарий от Harald 05.02.20 17:01:46 MSK

Так-ссс. (Это был треск разрываемого шаблона.) Кажись дошло. Т.е. ты хочешь сказать, когда я делаю accept() на слушающий сокет, и мне возвращается fd, ядро диспатчит входящие пакеты на fd по всем четырём полям, поэтому одному локальному (хост, порт) может соответствовать несколько fd?

dimgel ★★★★★
(05.02.20 17:16:39 MSK)

Ответ на: комментарий от dimgel 05.02.20 17:16:39 MSK

Нет, но fd, возвращаемых accept()-ом, может быть больше, чем 65536

Harald ★★★★★
(05.02.20 17:20:45 MSK)
Последнее исправление: Harald 05.02.20 17:21:12 MSK (всего исправлений: 1)

Ответ на: комментарий от Harald 05.02.20 17:20:45 MSK

Перечитал твою ссылку ещё раз.

Inside the TCP stack, these four fields are used as a compound key to match up packets to connections (e.g. file descriptors).

Так что таки да. Ну да и пофиг – как и то что я 20 лет пребывал в заблуждении, и то что помру шибко умным. За инфу спасибо. :)

dimgel ★★★★★
(05.02.20 17:23:51 MSK)

Ссылка

Ответ на: комментарий от V1KT0P 05.02.20 16:25:03 MSK

Спасибо. В целом у вас много разумных мыслей, были похожие.

~~igloev~~
(05.02.20 21:42:30 MSK) автор топика

Ссылка

Ответ на: комментарий от peregrine 04.02.20 21:17:12 MSK

Если сделать свою крипту, то весь ресурс превратится в площадку для пампа этой крипты.

anonymous
(05.02.20 23:12:16 MSK)

Ответ на: комментарий от menangen 05.02.20 06:41:48 MSK

Даже такая простая каптча отвернёт кучу ботов, 99%

Но ведь сложная капча для того делается, чтобы боты не научились её программно проходить?

vodz ★★★★★
(06.02.20 15:11:03 MSK)

Ссылка

Ответ на: комментарий от anonymous 05.02.20 23:12:16 MSK

А ты не давай её выводить.

peregrine ★★★★★
(06.02.20 15:11:35 MSK)

Ссылка

Какой-то бред.

Смысл в том, что если клиент захочет запустить много-много параллельных процессов, то это будет стоить ему в разы больше памяти, чем серверу.

Ну и запустит он их не все параллельно, а поменьше, остальное будет происходить последовательно. Сильно легче что ли станет? Всё равно же можно тысячами регать ежесекундно, причём автоматизация уже лежит в основе.

Альтернативы этому подходу.

Капча, подтверждение по e-mail (и отшивать, если e-mail сервер левый, и с него идёт слишком много регистраций). Это, по крайней мере, действительно работает, в отличие от.

anonymous
(06.02.20 15:46:20 MSK)

Ссылка

Ответ на: комментарий от i-rinat 04.02.20 02:30:58 MSK

Речь о том, что задача подбора части хеша не приносит пользы человечеству

Я ничего не понял, при чем тут польза человечеству если я хочу просто пресечь флуд? Как будто какие-то другие алгоритмы и вычисления приносят пользу человечеству?

loz ★★★★★
(07.02.20 12:45:11 MSK)

Ссылка

11 февраля 2021 г.

Ответ на: комментарий от Harald 04.02.20 02:53:30 MSK

Можно генерировать в фоне и сохранять в какой-нибудь Redis для дальнейшего использования.

anonymous
(11.02.21 15:13:12 MSK)

Ссылка

Смысл в том, что если клиент захочет запустить много-много параллельных процессов

ну разве что у тебя нет вообще никаких средств защиты от многократных входящих с одного хоста. А так давно уже все написано для того чтобы собирать метрики сетевой активности подобной этой в реалтайме и либо ее дропать либо дросселировать и если не помогает, то дропать, короче «ненужно».

anonymous
(11.02.21 17:36:19 MSK)

Ссылка

С 10тью гигабайтами памяти можно одновременно долбить 156250 воркеров с регистрациями. На двух серверах *2. На амазоне на час снать ресурсов на 10 баксов. И вся система геристрации ляжет и миллионы ников пропишутся в базу данных откуда их уже не вынуть ибо хрен пойми реальный или бот. Конечно это отсейчёт локалхостников мамкиных )) Но не более того.

anonymous
(11.02.21 17:46:20 MSK)