LINUX.ORG.RU

Использование spamassassin с mysql

 ,


0

0

Spamassassin является одним из самых популярных решений для борьбы со спамом. По умолчанию для хранения накапливаемых данных используются локальные файлы, однако для этой цели гораздо лучше использовать какой-нибудь SQL-сервер, что даёт огромное количество преимуществ.

Например, если почтовый сервер обрабатывает большой поток писем, то можно уменьшить нагрузку на него за счёт выноса SQL-сервера на отдельный физический сервер. Если в фирме используется несколько небольших почтовых серверов, то можно поставить общий для всех SQL-сервер. В этом случае качество фильтрации спама заметно вырастет.

Наконец, многие почтовые клиенты для локальной фильтрации спама используют spamassassin и имеют, кроме всего прочего, кнопки «Спам» и «Не спам», позволяющие "обучать" spamassassin. Внутри компании можно подключить spamassassin на рабочих станциях пользователей к SQL-серверу корпоративного почтовика. В таком случае пользователи дополнительно будут обучать spamassassin, и качество фильтрации поднимется на очень большую высоту.

В статье описано, как реализовать обучение spamassassin пользователями почтового сервера.

>>> Статья

★★★★

Проверено: Shaman007 ()

bogofilter - "наше фсио", как говорится.. :-) По крайней мере, если использовать его на отдельном взятом компе.. spamassasin натужнее проверяет..

My_quest ★★★★★
()
Ответ на: комментарий от anonymous

как достали эти админы .. настройщики антиспама .. хочу получать все .. весь спам .. все письма ..

anonymous
()

люблю читать спам по утрам, как же я теперь без него?(((

anonymous
()

спам - наше всио!

anonymous
()

О шаман проверял =)
s/Встатье/В статье/

D4rk4
()

Утопия.

Чтобы пользователи пользовались кнопками "спам" и "не спам"? Утопия. Они не все почту умеют "удалять" из папки "входящие", а тут такие выкрутасы.

Camel ★★★★★
()
Ответ на: Утопия. от Camel

Значит, фильтрация почты будет идти по интересам тех, кто умеет пользоваться этими кнопками. Если "продвинутые пользователи" где-то сочтут, скажем, что "автомобили недорого" - это спам, значит, и "непродвинутым" ничего про автомобили знать не стоит ;-)

PS. Имхо, флажок "спам/не спам" - это, хоть и что-то, но не всё, что анализатор мог бы получить в качестве обратной связи. Например, если тебе пришло письмо, и эта штука (=анализатор) его опознала как спам, а ты на это никак не отреагировал, то знания у этой штуки о спаме не прибавилось. Полезно было бы, если бы ты мог сказать - "да, это действительно спам".

alexsaa
()
Ответ на: комментарий от alexsaa

У спамассасина хроническая серъезная проблема : он cчитает текст в разных русских кодировках разным. поэтому байес не срабатывает. Тыща бесплатных интернетов тому кто это сделает!

anonymous
()

>лучше использовать какой-нибудь SQL-сервер, что даёт огромное количество преимуществ.

Бред какой. Бенчмарки в студию!

Достали одминчеги, которые изобретают вот такие вот мегасхемы.

anonymous
()

Статью не читал, но абсракт бредовый. Асасин жрет столько памяти и проца, что формат его базы неважен. Да и аффтор любитель велосипедов для увеличения производительности на процент

tereshchenko ★★
()
Ответ на: комментарий от tereshchenko

> Статью не читал, но абсракт бредовый. Асасин жрет столько памяти
> и проца, что формат его базы неважен. Да и аффтор любитель велосипедов
> для увеличения производительности на процент
> tereshchenko (*) (05.04.2008 0:56:42)

списки дебияна, лкмл, и все популярные, что мне известны страдают от
спама. Чекать "To:" и "In-Reply-To:" + черный список на умных и тема
закрывается. Не блин, шитосасин и прочий крап всё живёт и "развиватся".
-- 
sed 'sed && sh + olecom = love' << ''
-o--=O`C
 #oo'L O
<___=E M

olecom
()

Давно известно, что использование MySQL повышает процент шелковистости на 15. Даже не смотря на то, что spamassassin с его баесом написан на perl.

anonymous
()

Боги, дайте мне йаду!

В качестве единственного способа централизованного хранения простейшего словаря предлагается полноценная _реляционная_ БД!

Это даже не из пушки по воробьям -- это сразу термоядерной бомбой тараканов!

Die-Hard ★★★★★
()
Ответ на: комментарий от Die-Hard

что ты понимаешь. ;) Это же чистой воды интырпрайз солюшин. Там же написано в плюсах решения, что для БД было бы круто поставить отдельный сервер. Один сервер с почтовиком, второй со спамотсасином, третий с БД. Как никак, а какой-то уже интырпрайз. А то привыкли, web/mail/bd на пнях 133 ставить. Никакого понту.

mrdeath ★★★★★
()

в maia mailguard sa так и используется. ничего нового.

anonymous
()
Ответ на: комментарий от mrdeath

>А то привыкли, web/mail/bd на пнях 133 ставить. Никакого понту.

А на сайте еще несколько "полезной информации". Прочитав "Всё в одном: настраиваем fetchmail" я плакалъ.

anonymous
()

Грейлистинг наше все!

Пробовал спамассасин, пропускал 10% спама, как ни крути (в разумных пределах). Поставил грейлистинг, спама проходит 1% (в блоге - подробности).

http://vvh-dev-ru.blogspot.com/2008/03/greylisting_30.html

Особо повернутым можно спамассасин и грейлистинг совмещать -нагрузка на сервак будет минимальной и оставшийся спам будет худо-бедно резаться.

anonymous
()
Ответ на: комментарий от mrdeath

> Это же чистой воды интырпрайз солюшин. Там же написано в плюсах решения, что для БД было бы круто поставить отдельный сервер. Один сервер с почтовиком, второй со спамотсасином, третий с БД.

Понимаешь.. Для десяти почтовых ящиков можно всё на одной железке собрать. Но если количество ящиков составляет тысячи и тем более десятки тысячи - пора задумываться о более разумном использовании вычислительных мощностей.

Можно по прежнему всё держать на одной железке и умощнять её до беспредела. А можно поставить несколько железок и в итоге это получиться чуть-чуть но дешевле.

MooSE ★★★★
() автор топика

dspam лучше сделан, и удобнее в администрировании при туче клиентов...

anonymous
()
Ответ на: комментарий от Die-Hard

не переживай, йад будет.

предположи, что почтарей может быть несколько.
удаленно разнесенных, в общем находящихся в перди мира.
чтобы не велосепедится с синхронизацией словарей ассасина на всех машинах, ее и хранят в бд.

chocholl ★★
()
Ответ на: комментарий от MooSE

>Можно по прежнему всё держать на одной железке и умощнять её до беспредела. А можно поставить несколько железок и в итоге это получиться чуть-чуть но дешевле.

Блин, хватит выпендриваться!

По сцылке ходил?

Труды аффтарафф читал?

Да хрен у них есть опыт поддержки почтового сервера на пару десятков пользователей!

Нефиг щеки раздувать и делать умный вид!

anonymous
()
Ответ на: комментарий от chocholl

>Грейлистинг наше все!

Пробовал спамассасин, пропускал 10% спама, как ни крути (в разумных пределах). Поставил грейлистинг, спама проходит 1% (в блоге - подробности).

Ваше все! А Вы пробовали установить грейлистинг в продакшин?

Думаю что через 10-30 мин после установки такого костыля вас изнасилуют а потом повесят в качестве пугала для будущего админа:))) Представьте сидит бух/манагер/босс/секретутка (подставить по вкусу) общается по телефону и просит банк/клиента/любовницу/турфирму выслать письмо;) Как Вы думаете через сколько их письмо попадёт на "ваш" сервер? Даже не смотря на настройку задержки грейлистинга в 1-5 мин отлупившиеся письма попадут на серв при следующем прогоне очереди на сервере клиентов, а это от 15/30мин и до....

НОРМАЛЬНАЯ фильтрация helo + clamav + spamassassin решает проблему спама на 99.9%

ну вот как то так:)

anonymous
()
Ответ на: комментарий от chocholl

удаленно разнесенных, в общем находящихся в перди мира. чтобы не велосепедится с синхронизацией словарей ассасина на всех машинах, ее и хранят в бд.

Откройте для себя cron+rsync по ночам;) Не боитесь что далеко стоящие сервера будут мучительно долго и часто стучаться к серверу sql? а при тормозах в канале? а при отваливании канала? Мы живем в России а тут бывает всякое:)

anonymous
()
Ответ на: комментарий от anonymous

> Ваше все! А Вы пробовали установить грейлистинг в продакшин?

> Думаю что через 10-30 мин после установки такого костыля вас изнасилуют а потом повесят в качестве пугала для будущего админа:))) Представьте сидит бух/манагер/босс/секретутка (подставить по вкусу) общается по телефону и просит банк/клиента/любовницу/турфирму выслать письмо;) Как Вы думаете через сколько их письмо попадёт на "ваш" сервер? Даже не смотря на настройку задержки грейлистинга в 1-5 мин отлупившиеся письма попадут на серв при следующем прогоне очереди на сервере клиентов, а это от 15/30мин и до....

Первое письмо от них, да - попадет с задержкой в среднем 15-30 минут. А последующие будут в autowhitelist, и сколько они там будут - от вас зависит (по дефолту 3 дня). Так что не все так страшно.

Притом можно в белый список заранее домены и мыла вносить. Если и первое письмо обработать срочно надо - добавляем домен или мыло в вайтлист ручками (менеджер это делает) и просим клиента послать мыло заново.

anonymous
()
Ответ на: комментарий от anonymous

>письма попадут на серв при следующем прогоне очереди на сервере клиентов, а это от 15/30мин

И чего? Насколько я помню, smtp не подразумевает мгновенную доставку сообщений.

Sun-ch
()
Ответ на: комментарий от anonymous

>Первое письмо от них, да - попадет с задержкой в среднем 15-30 минут. А последующие будут в autowhitelist, и сколько они там будут - от вас зависит (по дефолту 3 дня). Так что не все так страшно.

Вы представляете что такое бизнес и что значат для него задержки даже в 15 минут? Когда манагеров больше 300 + логисты(таможня) + склады + бухгалтерия и тд + несколько тысяч клиентов у которых может быть почта на бесплатниках типа mail.ru yandex.ru rambler.ru... Добавлять все эти домены в вайтлисты? Когда вам звонит манагер а на другой линии у него висит клиент и спрашивает почему ему все еще не пришла почта или "наше" письмо не дошло клиенту (грейлистинг на стороне клиента)? Клиенты могут делать заказ раз в пол года раз в день раз в час.. А если это логисты у которых стоят машины на таможне(сколько там стоит час простоя?) Продолжить список?

>Притом можно в белый список заранее домены и мыла вносить. Если и первое письмо обработать срочно надо - добавляем домен или мыло в вайтлист ручками (менеджер это делает) и просим клиента послать мыло заново.

Издеваетесь да? Клиенты имеют свойство появляться и исчезать Например сегодня к нам пришло x*10 новых клиентов И ЧО? Сами будете обзванивать клиентов с просьбой отправить еще раз письмо?:)) А потом из очереди приедет старое письмишко и манагер обязательно позвонит и спросит че за нах такой:)

А если у вас таких серверов десятки?;) Не устанете подкручивать фильтр и отвечать на звонки в перерывах бегая за корвалолом и вазелином?:)

Посмотрите на всех НОРМАЛЬНЫХ ДОМЕНАХ нет грейлистинга или Вы думаете что там нет спама?

ИМХО для маленькой компашки в 3 человека грейлистинг будет нормальым решением ну или для домашнего почтовичка если ваша девушка/жена понятливая и терпеливая а для большой компании когда задержки даже в минуту стоят огромных денег данная технология неприменима! Все это давно и много раз обсуждено на разных проф ресурсах. Жирное Точко.

anonymous
()

<offtopic>Буквально сегодня пришло спамерское письмо от человека с говорящими именем и фамилией -- Боян Безбатько. >_< </offtopic>

Demon37 ★★★★
()
Ответ на: комментарий от Sun-ch

>И чего? Насколько я помню, smtp не подразумевает мгновенную доставку сообщений.

Вы это когда нить кому нить объясняли? или может давали читать rfc?

Клиент: мне не пришло письмо от партнёров Одмин: Вы знаете что по рефеце почта может доставлятЬся с задержками или вообще потеряцо по дороге Клиент:А от других мне нормально доходит иди разбирайся Одмин: На те вот прочитайте доки о работе почтовой системы и плагинов Клиент: ок у меня остался еще звонок другу Клинет: алло босс тут это одмин выеживается говорит что почта может на наши почтовики вообще потеряццо или долго идти а вот на маил ру она приходит за секунды и не пропадает! за что мы платим админу?! Босс: алло одмин тут звонил топ манагер и сказал что у него срывается сделка с клиентами на несколько лемонов. Ты зайди ка ко мне и захвати с собой свои RFC и чО нить к чаю поседим почЕтаем

Сан-ныч тролим? Я думал Ты знаешь что такое бизнес переписка:)

anonymous
()
Ответ на: комментарий от anonymous

> Откройте для себя cron+rsync по ночам;)

cron, rsync, reload асасина, и еще несколько лишних дел.
а если обмен должен быть двусторонним (нормальная практика в синхронизации правил ассасина), то открывать, наверно, нужно еще и grep, awk, и, .... зачем?
к тому же ночь, понятие ратяжимое, где ночь, а где, знаете, люди и работаю уже...


> Не боитесь что далеко стоящие сервера будут мучительно долго и часто стучаться к серверу sql? а при тормозах в канале? а при отваливании канала? Мы живем в России а тут бывает всякое:)

я говорю о построенной корпоративной сети, где есть qos, sla, и гарантированное обслуживание
гавноконторы у которых отваливаются каналы в расчет не беру.

chocholl ★★
()
Ответ на: комментарий от anonymous

Я прекрасно знаю, что это такое. И все люди, которые ей пользуются, прекрасно понимают, что время доставки письма - велична неопреленная.

А если босс устроил свой бизнес так, что он зависит от качества работы mail.ru и прочих помоек, то он не бизнесмен, а ларечник.

Sun-ch
()
Ответ на: комментарий от chocholl

>я говорю о построенной корпоративной сети, где есть qos, sla, и гарантированное обслуживание гавноконторы у которых отваливаются каналы в расчет не беру.

Установите эту связку и проверьте как она будет работать на нескольких серверах хотя бы при 1000 писем в минуту

Не говноконторы с адекватными админами не будут связываться с spamassassinom а купят к примеру того же каспера так же как не будут ставить самосбор вместо брендатых машин ибо админу в крен не уперлось мучатся и подставлять свой зад экономя дядину копейку.

>А если босс устроил свой бизнес так, что он зависит от качества работы mail.ru и прочих помоек, то он не бизнесмен, а ларечник.

Тут Я с вами полностью согласен. Но таков бизнес в России. Отрылась лавка перекупщиков занимается продажей лаптей в конторе 3/2 калеки на одмина и сервера босс денег не даст иба нафег?! есть же маил ру!!! А мне как большой фирме надо бы сбагривать лапти тоннами и чем больше у меня крупно/мелко оптовых покупателей тем лучше Или же мне отдавать ящики своего домена таким неимущим недокомпаниям?)))

За много лет обслуживания почтовых северов такого насмотрелся%)

ЗЫ могу дать парочку примеров: банковские работники общающиеся с клиентами через маил ру так же конторы заказчиков, а Вы обзвоните их и спросите почему они сидят и общаются через бесплатные почтовики

Доступ к которым кстати у работников в нормальных конторах закрыт вообще

anonymous
()
Ответ на: комментарий от anonymous

> Установите эту связку и проверьте как она будет работать на нескольких серверах хотя бы при 1000 писем в минуту

исправно себе работает, несколько проектов было.

chocholl ★★
()
Ответ на: комментарий от anonymous

>Не говноконторы с адекватными админами не будут связываться с spamassassinom а купят к примеру того же каспера так же как не будут ставить самосбор вместо брендатых машин ибо админу в крен не уперлось мучатся и подставлять свой зад экономя дядину копейку.

>ЗЫ могу дать парочку примеров: банковские работники общающиеся с клиентами через маил ру так же конторы заказчиков, а Вы обзвоните их и спросите почему они сидят и общаются через бесплатные почтовики

>Доступ к которым кстати у работников в нормальных конторах закрыт вообще

Тебе ответить почему?

Да потому, что робяты купили каспера или не приведи господь лотус. Откат разложили по карманам, посчитали задачу выполненной, а менеджерам мылом обмениваться как-то с внешним миром надо...

Сам видел, как сначала приходят с таких сраных фирм (в основном банки и страховые компании) письма в формате бд лотус, а потом все их сотрудники поголовно переходят на майл ру, а сраный лотус и касперский используют только для внутренней переписки.

Зато манагеры рапортуют о внедрении новых корпоративных стандартов, а некоторые даже дачи на откаты сумели построить.

anonymous
()
Ответ на: комментарий от anonymous

>Тебе ответить почему? Да воопсчем та знаю Я. Вот и о каком грейлистинге может идти речь:)

anonymous
()
Ответ на: комментарий от anonymous

>> Добавлять все эти домены в вайтлисты?

Когда же дойдёт до некоторых, что списки должны быть не белыми, а черными.

anonymous
()
Ответ на: комментарий от anonymous

>Когда же дойдёт до некоторых, что списки должны быть не белыми, а черными.

А Вы случаем не в маил ру работаете? очень похоже на их методы
block 0.0.0.0/4

anonymous
()
Ответ на: комментарий от anonymous

>>Когда же дойдёт до некоторых, что списки должны быть не белыми, а черными.

>А Вы случаем не в маил ру работаете? очень похоже на их методы >block 0.0.0.0/4

Вы неправильно меня поняли. Я говорил о том, что "грейлистить" нужно не всех подряд, а некоторых, например, безымянных.

А mail.ru, да, мне тоже не нравится.

anonymous
()
Ответ на: комментарий от anonymous

Еще раз перечитайте ветку:)
Я знаю около 100 постоянных доменов из них моих штук 10
которые конечно же во всех белых листах.
А вот безымянных как я писал выше бывает x*X в день.
Они появляются и исчезают пачками;) 
манагеры очень активные звери:)

anonymous
()
Ответ на: комментарий от anonymous

>Еще раз перечитайте ветку:)

Да уж читал-читал. Только я говорю о том, что не нужно "грейлистить" письмо на осовании единственного критерия - что его нету в вашем белом списке, а нужны ещё кое-какие основания для этого. Понимаете? Вот например, приходит к вам письмо с ns.malenkaya-kontora.com первый раз, так вот не надо его обижать, даже если его нету у вас в списке. А вот если c ip-2-12-85-06.dsl.hometv.spam , то тогда, может быть, можно такое загрейлистить.

anonymous
()
Ответ на: комментарий от anonymous

>А вот если c ip-2-12-85-06.dsl.hometv.spam Почтовик с номально настроенным helo отсечет такой адрес не успев отдать его грейлистингу;) Сказать почему? потому что у нормальных почтовиков не может быть такого адреса а напрямую (клинт> мой сервер 25 порт) шлют только спамеры отсюда и такие адреса ибо нормальный обмен должен быть клиент <> ЕГО сервер <> МОЙ сервер <> клиент;)

anonymous
()
Ответ на: комментарий от anonymous

>если c ip-2-12-85-06.dsl.hometv.spam Почтовик с номально настроенным helo отсечет такой адрес не успев отдать его грейлистингу;) >Сказать почему? потому что у нормальных почтовиков не может быть такого адреса

Раньше, я тоже так думал, что не может, но это было по неопытности и невежеству. Возможно, Вам тоже придётся изменить свое мнение. Удачи :)

anonymous
()
Ответ на: комментарий от anonymous

Еще раз повторюсь
нормально отстроенный почтовый сервер режет много ЯВНОГО спама сам
 без всяких rbl проверок mx и тд.
Далее отдает письма пришедшие не с наших доверенных доменов spamassassin который только  метит спам
 после локальный доставщик кладет нормальное письмо во входящие а спам
в папку spam где юзер сам дополнительно проверяет спам это или  нет так как как бы не были обучены спам плагины они все равно иногда ошибаются.
 
Решать удалить письмо или оставить должен только сам пользователь 
а не мы полагаясь на спам фильтры.
И создавать дополнительные задержки для многих компаний не применимо 
тем более как написали выше что сам протокол не обещает быстрой доставки 
 + еще мы его тормознем 

anonymous
()
Ответ на: комментарий от anonymous

>Раньше, я тоже так думал, что не может, но это было по неопытности и невежеству.

Примеры таких нормальных почтовиков есть? давайте мы все на них посмотрим заодно можно будет отправить письмеццо postmaster'ам этого сервера с добрыми словами

И вам не скучать! :)

anonymous
()
Ответ на: комментарий от anonymous

>Примеры таких нормальных почтовиков есть? давайте мы все на них посмотрим заодно можно будет отправить письмеццо postmaster'ам этого сервера с добрыми словами

Не серчай, это пишет другой анонимус... Сейчас выдать тебе пример не могу. Но были у меня самого такие сервера. Аж два. И не столько я такой занюханый был админ, сколько мои провайдеры, они же реестраторы, они же держатели ящиков, в которые сваливалось все, что предназначалось этим компаниям + весь спам, по непонятным причинам, сваливаемый провайдерами в те же ящики. В заголовках писем при этом - ни малейшего упоминания о доменах этих компаний. Я вытягивал это добро фетшмейлом с энвелопенами и т.п.

Провайдеры эти - Укртелеком и ИП-телеком. Как, тебе не поплохело?

И только в прошлом году появилась техническая возможность поменять этим фирмам провайдера на Гольдентелеком, а поддержку домена с большим трудом забрать себе через имена.уа

Так, что не покажу, но, если в Киеве такие провайдеры и такие техвозможности, представляю что творится в областях.

anonymous
()
Ответ на: комментарий от anonymous

ага,очень хорошо грейлист работает с маил.ру гугл.ком яндекс.ру когда письмо получает первый отлуп, ОНО шлётся уже с другого домена и получает 2-й отлуп и в следующий уже с третьего домена 3-й отлуп и придёт отчёт о недоставке.
Пример:
1 sp1-x.googlemail.com отлуп
2 fr3-l.googlemail.com отлуп
3 sq1-k.googlemail.com отлуп

вот вам и грейлист, письмо к вам так и не попадает.

aspel
()
Ответ на: комментарий от anonymous

>>Не серчай, это пишет другой анонимус

Чтож другой анонимус отвечу и вам Если у вашей фирмы нет возможности держать свои сервера то оплачивайте хостинг там вам выдадут почти полноценные почтовики если нет денег и на хостера то закрывайте свою компанию. Даже если ваша почта была у провайдера (как Вы ее забирали никому не интересно) то провайдер для отправки вашей корреспонденции должен был предоставить свой smtp сервер с логином и паролем а не давать вам доступ к 25 порту всего интернета.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.