Система поиска в файлах netflow

0

1

Доброго времени суток, господа. Существует-ли какой-нибудь софт, позволяющий выполнять быстрый поиск и выборку из файлов netflow? Или все свои велосипеды пишут?

Ссылка

← Сделать AJAX XMLHttpRequest запрос «POST» не в UTF-8 ???

[git] Параллельные ветки →

flow-tools ? :)

Jetty ★★★★★
(12.10.11 13:57:47 MSK)

Ссылка

netflow это протокол, нет никаких файлов

hizel ★★★★★
(12.10.11 13:58:27 MSK)

Ответ на: комментарий от hizel 12.10.11 13:58:27 MSK

Да что вы говорите... Т.е. по вашему мнению сырой нетфлоу никак не сторится для дальнейшего анализа ? :)

Jetty ★★★★★
(12.10.11 15:16:36 MSK)

Ответ на: комментарий от Jetty 12.10.11 15:16:36 MSK

я говорю о том, что спека netflow никак не определяет хранение, следовательно нельзя говорить о файлах netflow

hizel ★★★★★
(12.10.11 15:29:00 MSK)

Ответ на: комментарий от hizel 12.10.11 15:29:00 MSK

А я говорю о том что обычно сторят флоу(иначе зачем его собирать постоянно????), а потом парсят под нужные цели. И делается это по традиции обычными флоу коллерторами, например флоу-тулз и похер в даном разрезе на то что там в спеке, потому что флоу тулз так же дает конверте бин-текст... И кстати насколько мне не изменяет память, они все хранят флоу в «сыром» виде, т.е. без каких-либо контейнеров...

Jetty ★★★★★
(12.10.11 16:04:50 MSK)

Ответ на: комментарий от Jetty 12.10.11 16:04:50 MSK

Netflow - это протокол и определен только формат датаграмм.
Формат файлов определяется конкретным ресивером датаграмм Netflow.

Ресивер может просто сохранять сырые датаграммы в файл или может парсить на лету. Первое предпочтительнее, так как поток Netflow с больших железок может быть ОЧЕНЬ интенсивным и UDP датаграммы будут дропаться если тратить время на парсинг.

Когда я писал свой ресивер все было просто - в файл сначала писался timestamp (4 байта, UNIX time), а потом сама сырая UDP датаграмма.
Таймстамп был нужен, так как только время сервера считалось 100% корректным (нельзя было завядываться на время на железках).

Соответственно имея файл с сырыми датаграммами можно написать элементарный парсер, который анализирует заголовок Netflow и исходя из него парсит тело пакета.

И вот тут возникает вопрос про «быстрый поиск». Очевидно, что формат который я описал вообще не оптимизирован под поиск. Возможно из этого формата можно данные переконвертировать в другой, более подходящий под конкретные выборки (и наверняка можно агрегировать записи, что существенно уменьшит размер файла и увеличит скорость поиска).
Основная идея - любой парсинг/переконвертазию/агрегацию должен выполнять не ресивер, а отдельный парсер, работающий на уже собранных данных (опять же для скорости приема и во избежание потери UDP датаграмм).

Krivenok_Dmitry ★
(12.10.11 17:22:58 MSK)

Ответ на: комментарий от Krivenok_Dmitry 12.10.11 17:22:58 MSK

Хм... А зачем вы МНЕ такую простыну написали? Я в курсе что да как, в отличии от.
И не ресивер, а коллектор :))) Хотя с функциональной стороны они весьма подобны.

P.S. Автор просил ответа на вопрос, а не теоретического флуда. Оцените мой ответ и Ваш ответ.

Jetty ★★★★★
(12.10.11 17:35:34 MSK)

Ответ на: комментарий от Jetty 12.10.11 17:35:34 MSK

вам он озвучил простую мысль, что хранить, даже в таком простом случае, можно в стопицот разных форматах

hizel ★★★★★
(12.10.11 19:31:18 MSK)

дотошники с хабры такие дотошники

Существует-ли какой-нибудь софт, позволяющий собирать и сохранять netflow с возможностью быстрого поиска и выборки в сохраненной им информации?

//FIXED

redixin ★★★★
(12.10.11 19:43:00 MSK)

Ответ на: дотошники с хабры такие дотошники от redixin 12.10.11 19:43:00 MSK

первый ответ.
flow-tools :)

Jetty ★★★★★
(12.10.11 23:41:40 MSK)

Ответ на: комментарий от hizel 12.10.11 19:31:18 MSK

ТС спросил конкретную вещь. А вы вместо конкретного и нормального ответа начали какойто теоретический бред нести, который мало того что бесполезен в контексте вопроса, так еще и легко запутает ТСа...

Jetty ★★★★★
(12.10.11 23:44:59 MSK)

Ссылка

Ответ на: комментарий от Jetty 12.10.11 23:41:40 MSK

да ну? и быстрый поиск и выборку оно тоже умеет?

redixin ★★★★
(13.10.11 00:13:46 MSK)

Ответ на: комментарий от redixin 13.10.11 00:13:46 MSK

Смотря что вкладывать в понятие «быстрый» xD

Jetty ★★★★★
(13.10.11 01:35:57 MSK)

Ссылка

Ответ на: комментарий от redixin 13.10.11 00:13:46 MSK

А еще смотря какие объемы флоу...
когда-то с помошью nfilter и stat нормально выгребалась информация...

Jetty ★★★★★
(13.10.11 01:39:42 MSK)

Ссылка

Использую nfsen. Удобнее чем flow-tools, хотя и не без недостатков.

kernelpanic ★★★★★
(13.10.11 01:40:56 MSK)

Ссылка

Буду невежливым, задам новый вопрос не проверяя указаный вами софт.

А flow-tools/nfsen индексируют свои файлы, или при просто пишут как есть, а последующие выборки и поиск производятся методом последовательного чтения?

~~dmitryalexeeff~~ ★
(13.10.11 12:06:00 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Сделать AJAX XMLHttpRequest запрос «POST» не в UTF-8 ???

Development

[git] Параллельные ветки →

дотошники с хабры такие дотошники

Похожие темы