Rspamd 1.4 (и Rmilter 1.10)

2

3

Rspamd — это система фильтрации спама для электронной почты, написанная на C и Lua в качестве более производительной замены SpamAssassin и ориентированная на применение в крупных почтовых кластерах.
Rspamd поддерживает почти все возможности SpamAssassin и имеет ряд особенностей, позволяющих фильтровать почту в среднем в 10 раз быстрее, а также обеспечивать более качественную фильтрацию.

Сегодня, после четырёх месяцев разработки, состоялись релизы Rspamd 1.4 и Rmilter 1.10. Обновления включают в себя ряд новых функций, таких как поддержка пулов соединений с Redis, новые модули, улучшенную поддержку нейронных сетей, компрессию с помощью алгоритма zstd для протокола и многие другие важные усовершенствования.

Пул соединений с Redis

Rspamd теперь может подключаться к Redis, используя пул постоянных соединений. Эта функция не требует каких-либо специальных настроек и позволяет повторное использование существующих соединений, улучшающих профиль нагрузки для Redis.

Новый плагин классификации с использованием нейросетей

В Rspamd был добавлен плагин для использования и обучения нейросетей, сохраняющий данные в Redis. Данный плагин позволяет кластеризовать результаты фильтров для более точной оценки потока писем. Использование Redis позволило распределять обучение и данные нейросетей по всему кластеру сканеров Rspamd.

Улучшения байесовского классификатора

Теперь для оценки вероятности спама используется больше метаданных. Сравнение классификатора в Rspamd с другими спам-фильтрами.

Новый плагин проверки сообщений антивирусами

Rspamd теперь может проверять сообщения с помощью сторонних антивирусов. Этот модуль предоставляет ряд функций:

Работа с различными типами антивирусных систем: ClamAV, Sophos и F-Prot.
Поддержка пользовательских шаблонов (например, экспериментальные базы данных для ClamAV).
Поддержка кеширования результатов.
Проверка только писем с вложениями, чтобы сохранить ресурсы антивируса.
Белые списки, ограничения на размер и пользовательские скрипты оценки результатов.

Плагин проверки MX записей

Rspamd теперь может проверить работоспособность MX отправителя для сканированных сообщений с помощью нового плагина проверки MX. Этот плагин полезен для защиты от сообщений с некорректными обратными путями (например, когда спам рассылается с ботнета, который не в состоянии принять ответ на письмо).

Поддержка компрессии в протоколе

Rmilter и Rspamd теперь поддерживают сжатие передаваемых данных алгоритмом zstd. Этот алгоритм является быстрым и эффективным средством для уменьшения загрузки процессора и сети при передаче данных и также используется для хранения больших объёмов данных в Redis (например, нейронных сетей).

Переработана система обработки ошибок DNS в SPF, DKIM и DMARC

Rspamd теперь может работать с временными ошибками при выполнении связанных с DNS проверками, например DKIM, DMARC или SPF. Существуют специальные символы для представления как временных, так и постоянных ошибок для этих плагинов.

Адаптивные и пользовательские лимиты

Модуль ratelimit теперь поддерживает адаптивные лимиты, то есть ограничения могут быть ужесточены для неизвестных или «плохих» отправителей, а для известных отправителей с хорошей репутацией — наоборот, расширены. Кроме этого, с новой версии данный модуль поддерживает пользовательские скрипты для создания собственных лимитов.

Мониторинг ресурсов

Добавлена поддержка проверки состояния внешних сервисов, например листов DNS. В этом режиме Rspamd проверяет, что DNSBL доступен и что он не заблокировал все адреса (что иногда приводит к курьёзным ситуациям). Если эти проверки не проходят, то такой ресурс на время игнорируется (до следующей проверки).

Redis бекенд для fuzzy хешей

Начиная с Rspamd 1.4 можно хранить нечёткие хеши в Redis. Это хранилище является более быстрым и масштабируемым, чем SQLite. Утилита rspamadm теперь умеет конвертировать хеши из хранилища SQLite в Redis.

Экспорт данных в graphite

В новой версии Rspamd может сохранять статистику, передавая данные внешней системе мониторинга (пока поддерживается только graphite). Также возможен экспорт данных в Redis pub/sub и Yandex Clickhouse (экспериментальный плагин).

Динамическая конфигурация в Redis

Эта функция полезна, когда нужно управлять несколькими экземплярами Rspamd централизованно. Пока что динамическая конфигурация ограничивается настройкой весов символов, действий и отключения определённых проверок. В будущем эти функции планируется расширить.

Настройки пользователей в Redis

Настройки пользователя теперь можно загружать из Redis. Это полезно, когда пользователей много и они часто обновляются. В таком случае нет необходимости каждый раз загружать настройки для всех пользователей.

Кольцевой буфер ошибок

Добавлена возможность сохранения ошибок работы в кольцевой буфер, отображающийся в web-интерфейсе и позволяющий быстро выявлять проблемы в работе Rspamd .

Сообщения для MTA

Теперь возможна передача сообщения, которое должно быть показано клиенту MTA, например при грейлистинге:

{ "messages": { "smtp_message": "Try again later"}}

Эта функция также поддерживается Rmilter 1.10.

Обновления Rspamd Lua API

В новой версии добавлен ряд новых возможностей в Lua API:

Периодические события:

rspamd_config:add_periodic(ev_base, 1.0, function(cfg, ev_base)
  local logger = require "rspamd_logger"
  i = i + 1
  logger.infox(cfg, "periodic function, %s", i)
  return false -- if return false, then the periodic event is removed
end, true)

Скрипты, выполняемые при старте или завершении процессов:

rspamd_config:add_on_load(function(cfg, ev_base, worker)
  if worker:get_name() == 'normal' then
    -- Do something
  end
end)

Поддержка новых хеш-функций (MD5, SHA1, SHA256, SHA512):

local hash = require "rspamd_cryptobox_hash"
hash.create_specific('md5', 'string'):hex()
-- b45cffe084dd3d20d928bee85e7b0f21

Поддержка https в lua_http.
Пакетное обучение нейросетей (в отдельном потоке).
Сжатие посредством zstd.

Изменения в веб-интерфейсе

Новая закладка настройки символов.
Таблица последних ошибок сканера.
Улучшенная загрузка вкладок.
По умолчанию пароли теперь нельзя применять для доступа к web-интерфейсу.

>>> Подробности

Ссылка

← ABCL 1.4.0

Релиз Fedora 25 →

AUR сёдня вечером обновлю, пока гоняю тесты.

post-factum ★★★★★
(22.11.16 17:48:23 MSK)

Ссылка

Ну и как, реально работает байес фильтрация? Я если бы захотел спамить, специально бы через эти баейс фильтрации гонял свой текст и морфировал бы каким-нибудь обратным баейсом или нейросеткой. Пока не пройдет со 100% гарантией.

А разве нет какого-нибудь хаба, где всякие гуглы, мейлру и прочие яху отсылали бы хеши писем и тем самым выявляли наиболее подозрительные письма/рассылки?

foror ★★★★★
(22.11.16 19:28:48 MSK)
Последнее исправление: foror 22.11.16 19:33:58 MSK (всего исправлений: 2)

Ответ на: комментарий от foror 22.11.16 19:28:48 MSK

хеши писем

Первая же идея по предотвращению спама — хранить N хешей недавно отправленных сообщений, и блокировать, если хеш нового сообщения повторяется. Это сразу же обходят изменяемыми компонентами в письмах. Пробел где-нибудь вставят ещё один, где-то таб, и так далее.

i-rinat ★★★★★
(22.11.16 19:40:58 MSK)

Проблема спама не в задроченности спам-фильтра, а в дырявости SMTP-серверов а-ля exim.

~~vblats~~ ★
(22.11.16 20:03:08 MSK)

Как раз в этом месяце на личный vps сервак поставил, а то что-то слишком много спама стало приходить. Ну что я могу сказать, вроде работает, большую часть удаляет сразу, что превысило установленное количество баллов (по дефолту 14, я повысил до 25), то что ниже идёт в папку спам. Иногда что-то пропускает мимо, что не могло набрать нужное количество баллов.

Но для личного сервачка что-то жесть, 4 процесса rspamd (main, controller, normal, hs_helper), 2 процесса rmilter, ещё redis пришлось ставить (без него в логи постоянно пишет ошибку что не мог подключиться к серверу redis с нескольких попыток), причём в мануале не указали где указать не использовать redis, хотя там говорится «может использовать redis», то есть будто это опционально.

anonymous
(22.11.16 22:38:10 MSK)

Ответ на: комментарий от anonymous 22.11.16 22:38:10 MSK

Но для личного сервачка что-то жесть, 4 процесса rspamd (main, controller, normal, hs_helper), 2 процесса rmilter, ещё redis пришлось ставить

А ты переподними всё то же самое под kubernetes'ом. И предыдущий вариант уже не покажется таким затратным.

ugoday ★★★★★
(22.11.16 23:50:24 MSK)

Ссылка

Спамеров нужно убивать.

Остальное - печальные недополумеры.

DRVTiny ★★★★★
(23.11.16 10:18:29 MSK)

Ссылка

Ответ на: комментарий от anonymous 22.11.16 22:38:10 MSK

Так эта приблуда вроде не для личного сервачка, а для более хардкорных случаев.

MrClon ★★★★★
(23.11.16 11:06:56 MSK)

Ссылка

Ответ на: комментарий от vblats 22.11.16 20:03:08 MSK

Разверни мысль

MrClon ★★★★★
(23.11.16 11:07:17 MSK)

Ссылка

Ответ на: комментарий от vblats 22.11.16 20:03:08 MSK

… в дырявости SMTP-серверов а-ля exim

Плюсую предыдущего оратора - хочу подробностей.

MumiyTroll ★★★
(23.11.16 12:10:39 MSK)

Ответ на: комментарий от MumiyTroll 23.11.16 12:10:39 MSK

Какие могут быть подробности ?

Ставь екзим или постфикс в продакшен, и через месяц начинай считать сколько незванных гостей используют твой сервак в качестве релея.

А если сервак еще и шарится между несколькими юзерами\доменами, то количество гостей стремится к бесконечности.

~~vblats~~ ★
(23.11.16 14:17:16 MSK)

Ответ на: комментарий от anonymous 22.11.16 22:38:10 MSK

В rmilter.conf: use_redis = false;

anonymous
(23.11.16 14:28:46 MSK)

Ответ на: комментарий от i-rinat 22.11.16 19:40:58 MSK

Ну это обходят тем, что считают хеши по полям и удаляют все пробелы и табуляции

~~AVL2~~ ★★★★★
(23.11.16 14:31:34 MSK)

Ссылка

Ответ на: комментарий от vblats 23.11.16 14:17:16 MSK

Посчитал. 0 незваных гостей за 7 лет эксплуатации Postfix.

anonymous
(23.11.16 14:38:49 MSK)

Ссылка

Ответ на: комментарий от vblats 23.11.16 14:17:16 MSK

С 2005 года «в продакшене» стоит постфикс. Уже скоро 12 лет, как он ни разу не был использовать незванными гостями в качестве релея. ЧЯДНТ?

anonymous
(23.11.16 17:49:28 MSK)

Ссылка

Ответ на: комментарий от vblats 23.11.16 14:17:16 MSK

Ставь екзим или постфикс в продакшен, и через месяц начинай считать сколько незванных гостей используют твой сервак в качестве релея.

Ты же забыл самую первую строку в инструкции!!! А там написано - «Извлеките руки из >|<0пы! Если не извлекаемо - наймите настоящего админа!» :)

anonymous
(23.11.16 19:14:52 MSK)

Ответ на: комментарий от anonymous 23.11.16 14:28:46 MSK

В rmilter.conf: use_redis = false;

Спасибо, что ж тут об этом нет? А не использование redis сильно скажется на мелком сервачке?

anonymous
(23.11.16 21:02:51 MSK)

Ответ на: комментарий от anonymous 23.11.16 19:14:52 MSK

Да да. Пердолинг и еще раз пердолинг. А потом костылинг. Потом возможно сервак будет защищен. До поры до времени.

SMTP - дырявый и устаревший, это настолько очевидно что даже обсуждать нет смысла.

~~vblats~~ ★
(23.11.16 21:03:03 MSK)

Ссылка

Ответ на: комментарий от vblats 23.11.16 14:17:16 MSK

Ставь екзим или постфикс в продакшен, и через месяц начинай считать сколько незванных гостей используют твой сервак в качестве релея.

Это надо как-то специально так настроить? Вроде даже по дефолту проблем нет. УМВР, хотя судя по входящему спаму таких отктырых релеев полно.

anonymous
(23.11.16 21:16:28 MSK)

Ответ на: комментарий от anonymous 23.11.16 19:14:52 MSK

извлеките руки из >|<0пы!

Скорее голову.

anonymous
(23.11.16 21:17:11 MSK)

Ссылка

Ответ на: комментарий от anonymous 23.11.16 21:16:28 MSK

Надо же, открываешь гугль, и стопицот вопросов на форумах, как бороться с таким спамом. А у вас прямо все идеально)

~~vblats~~ ★
(23.11.16 21:18:43 MSK)

Ответ на: комментарий от vblats 23.11.16 21:18:43 MSK

Надо же, открываешь гугль, и стопицот вопросов на форумах, как бороться с таким спамом. А у вас прямо все идеально)

А причём тут борьба со спамом? Ты начал про то что якобы постфикс дырявый и если его поставить, то через месяц с него будет идти спам. На это я тебе ответил что даже с дефолтными конфигами этой проблемы нет.

А спам приходит потому что кто-то свой сервер настраивал хрен знает как и он у них стал открытым реелеем из-за кривого конфигурирования (скорей всего дурачки не вникая накопипастили конфигов из интернетов).

как бороться с таким спамом.

Установить Rspamd, например.

Короче, из этого твоего комментария я сделал вывод что ты не понимаешь разницы между входящим сообщением, исходящим сообщением и вообще как работает почта. Уходи. Из-за таких как ты и существует проблема спама.

anonymous
(23.11.16 21:27:45 MSK)

Ответ на: комментарий от anonymous 23.11.16 21:27:45 MSK

Окай)

~~vblats~~ ★
(24.11.16 03:08:36 MSK)

Ссылка

Ответ на: комментарий от vblats 23.11.16 14:17:16 MSK

Ставь екзим или постфикс в продакшен, и через месяц начинай считать сколько незванных гостей используют твой сервак в качестве релея.

Как страшно жить в Вашем мире...

В реальности дефолтные конфигурации с открытым релеем закончились то ли в конце 90-х, то ли в начале нулевых. И даже тогда это была не «дырявость», а конфигурация. И уже точно более 10 лет ни в одном MTA не практикуется открытый релей в дефолтной конфигурации.

Впрочем, допускаю, что в предпочитаемом Вами дистрибутиве, либо неадекватные майнтайнеры, включающие открытый релей, либо exim/postfix/sendmail образца 90-х.

MumiyTroll ★★★
(24.11.16 11:03:23 MSK)

Ссылка

Ответ на: комментарий от vblats 23.11.16 14:17:16 MSK

Ставь екзим или постфикс в продакшен, и через месяц начинай считать сколько незванных гостей используют твой сервак в качестве релея.

Судя по его постам, ~~vblats~~ известный балабол.

Deisler ★
(24.11.16 14:37:05 MSK)

Ссылка

Ответ на: комментарий от anonymous 23.11.16 21:02:51 MSK

Без redis не будет работать почти половина модулей rspamd. А если захотите использовать bayes или fuzzy, то придется ставить sqlite3. В rmiltere грейлистинг и рейт-лимит тоже не будут работать (либо придется вместо redis ставить memcached) .

anonymous
(25.11.16 14:10:11 MSK)

Ответ на: комментарий от anonymous 25.11.16 14:10:11 MSK

Без redis не будет работать почти половина модулей rspamd. А если захотите использовать bayes или fuzzy, то придется ставить sqlite3. В rmiltere грейлистинг и рейт-лимит тоже не будут работать (либо придется вместо redis ставить memcached) .

Ясно, спасибо. Тогда стоило бы на сайте сменить формулировку, а то «может работать с redis» вводит в заблуждение, будто это опционально и без него работает так же, только менее производительно.

anonymous
(26.11.16 20:05:34 MSK)

Ответ на: комментарий от anonymous 26.11.16 20:05:34 MSK

стоило бы на сайте сменить формулировку, а то «может работать с redis» вводит в заблуждение, будто это опционально и без него работает так же, только менее производительно

А где именно это написано? Дайте, пожалуйста, ссылку.

anonymous
(26.11.16 20:46:12 MSK)