Circular logs

Старые логи при этом архивируются, но только один раз. Называется logrotate, есть такой демон.

former_anonymous ★★★
(07.10.13 13:15:38 MSK)

Зачем если можно просто ставить timestamp и никаких сбрасываний?

~~vertexua~~ ★★★★★
(07.10.13 13:17:24 MSK)

Ответ на: комментарий от former_anonymous 07.10.13 13:15:38 MSK

Да, наверное, сбросив счётчик, старые логи можно просто заархивировать, так должно быть проще и можно обойтись без StartMarker.

UVV ★★★★★
(07.10.13 13:18:25 MSK) автор топика

Ссылка

Ответ на: комментарий от vertexua 07.10.13 13:17:24 MSK

Зачем если можно просто ставить timestamp и никаких сбрасываний?

Лишние 4 байта(?) на одну запись, не?

UVV ★★★★★
(07.10.13 13:19:03 MSK) автор топика

А может и правда logrotate? всё написали до тебя.

Dark_SavanT ★★★★★
(07.10.13 13:25:32 MSK)

Ссылка

Ответ на: комментарий от UVV 07.10.13 13:19:03 MSK

Лишние 4 байта(?) на одну запись, не?

один файл :: одна запись ~сотня байт (раз уж 4 жалка) ?? и городятся они судя по всему часто

ох и нихрена себе..

MKuznetsov ★★★★★
(07.10.13 13:27:17 MSK)

Ссылка

Просто юзай systemd-journald :]

vasily_pupkin ★★★★★
(07.10.13 13:28:04 MSK)

Ссылка

Ответ на: комментарий от UVV 07.10.13 13:19:03 MSK

На имя файла

~~vertexua~~ ★★★★★
(07.10.13 13:28:09 MSK)

Покритикуйте механизм.

Велосипед^WМеханизм не нужен, есть logrotate.

И предложенная схема именования - говно, да.

tailgunner ★★★★★
(07.10.13 13:28:22 MSK)
Последнее исправление: tailgunner 07.10.13 13:28:34 MSK (всего исправлений: 1)

Ответ на: комментарий от vertexua 07.10.13 13:28:09 MSK

Ну ок, можно использовать timestamp файловой системы. А почему не сбрасывать счётчик тогда?

UVV ★★★★★
(07.10.13 13:43:18 MSK) автор топика

Ответ на: комментарий от tailgunner 07.10.13 13:28:22 MSK

Велосипед^WМеханизм не нужен, есть logrotate.

Как я понял из man'a, он хорош для демонов, и для него нужно ещё конфигурационный файл настраивать (т.е. на каждой запускаемой машине получается).

UVV ★★★★★
(07.10.13 13:51:56 MSK) автор топика

Тогда уж лучше пиши дату в формате, скажем, %Y%m%d_%T, а при формировании очередного файла считай, сколько их там, да удаляй самые старые.

~~Anon~~
(07.10.13 13:54:38 MSK)

Ответ на: комментарий от Anon 07.10.13 13:54:38 MSK

Дельно, спасибо.

UVV ★★★★★
(07.10.13 13:57:31 MSK) автор топика

Ссылка

Ответ на: комментарий от UVV 07.10.13 13:51:56 MSK

Как я понял из man'a, он хорош для демонов

Ему безразлично.

и для него нужно ещё конфигурационный файл настраивать (т.е. на каждой запускаемой машине получается)

Приличные люди включают этот файл в инсталляционный пакет.

tailgunner ★★★★★
(07.10.13 14:03:58 MSK)

Ссылка

Ответ на: комментарий от UVV 07.10.13 13:43:18 MSK

Не понимаю в чем твой вопрос. Просто делаешь имена с таймстемпом и этого достаточно, лишние можно удалять.

Вот идея

vertexua@vxcomp$ touch dump_log_`date +%s`.txt
vertexua@vxcomp$ touch dump_log_`date +%s`.txt
vertexua@vxcomp$ touch dump_log_`date +%s`.txt
vertexua@vxcomp$ touch dump_log_`date +%s`.txt
vertexua@vxcomp$ touch dump_log_`date +%s`.txt
vertexua@vxcomp$ touch dump_log_`date +%s`.txt
$ ls
dump_log_1381140052.txt  dump_log_1381140053.txt  dump_log_1381140054.txt  dump_log_1381140057.txt  dump_log_1381140080.txt  dump_log_1381140081.txt
vertexua@vxcomp$ ls * | sed -n 's/\(^dump_log_\([0-9][0-9]*\).txt\)/\1 \2/p' | sort -rn -k2 | tail -n +4 | awk '{print $1}' | xargs rm -v
удалено «dump_log_1381140054.txt»
удалено «dump_log_1381140053.txt»
удалено «dump_log_1381140052.txt»
vertexua@vxcomp$ ls
dump_log_1381140057.txt  dump_log_1381140080.txt  dump_log_1381140081.txt

~~vertexua~~ ★★★★★
(07.10.13 14:04:19 MSK)
Последнее исправление: vertexua 07.10.13 14:04:43 MSK (всего исправлений: 1)

Ответ на: комментарий от vertexua 07.10.13 14:04:19 MSK

sed там на кой черт? Просто по ctime сортируй: ls --time=ctime -r, а потом удаляй N первых.

~~Anon~~
(07.10.13 14:11:51 MSK)

Ответ на: комментарий от Anon 07.10.13 14:11:51 MSK

Да пофиг по чему, я просто хотел показать что вот есть таймстемпы в имени, которые в том числе добавляют уникальности ну и еще по ним можно сортировать. Но ctime вполне подойдет

~~vertexua~~ ★★★★★
(07.10.13 14:13:14 MSK)

Ответ на: комментарий от vertexua 07.10.13 14:04:19 MSK

Да, я уже понял идею, спасибо.

UVV ★★★★★
(07.10.13 14:35:34 MSK) автор топика

Ссылка

Ответ на: комментарий от Anon 07.10.13 13:54:38 MSK

а при формировании очередного файла считай, сколько их там...

Нашёл недостаток в этом подходе, подумываю опять вернуться к идее с маркером. Допустим я поставил ограничение 100к файлов, на файле 100001 мне нужно будет найти один старый и удалить, что займёт дофига времени.
Как вариант, конечно, можно просматривать файлы скажем не каждый раз, а 100к + 10%, к примеру, чтобы избежать слишком частых операций чтения/записи...

UVV ★★★★★
(07.10.13 17:02:33 MSK) автор топика

Ответ на: комментарий от vertexua 07.10.13 14:13:14 MSK

Либо создать ещё один поток, который просто следит за количеством файлов, проверяя их количество раз в минуту, допустим )

UVV ★★★★★
(07.10.13 17:10:36 MSK) автор топика

Ссылка

Ответ на: комментарий от UVV 07.10.13 17:02:33 MSK

Можно и без сортировки: имена файлов заносишь в отдельный файл. Количество файлов == количеству "\n", mmap'ом его подключай, чтобы не париться. Считаешь, сколько там файлов, вычисляешь количество лишних, удаляешь эти файлы с диска и список, начиная с номера самого старого файла, пересохраняешь. Времени на сортировку тратить не надо.

А если в начало файлика со списком логов сохранять и общее количество файлов, то совсем халява будет. Правда, это уже эдакая файло-ориентированная БД получится.

~~Anon~~
(07.10.13 17:11:59 MSK)

Ссылка

Ответ на: комментарий от UVV 07.10.13 17:02:33 MSK

100000 файлов обработаются моментально. Логи все равно все раз в день чистят. Даже если раз в час, то посчитай сколько времени понадобится тебе для достижения 100000

~~vertexua~~ ★★★★★
(07.10.13 17:17:47 MSK)

Писать сразу в запакованном виде.
logrotate - говно, не надо им пользоваться
на последний файл при его открытии просто делается ссылка, при закрытии файл переменуется. Т.е. текущий имеет имя в вида hhh_[date].log.gz.tmp после закрытия становится hhh_[date].log.gz
cтарые логи удаляются в кроне

vromanov ★★★
(07.10.13 17:18:30 MSK)

Ответ на: комментарий от vromanov 07.10.13 17:18:30 MSK

logrotate - говно, не надо им пользоваться

Обоснуй.

tailgunner ★★★★★
(07.10.13 17:19:17 MSK)

man logrotate

eliriand ★★
(07.10.13 17:19:43 MSK)

Ссылка

Ответ на: комментарий от vertexua 07.10.13 17:17:47 MSK

Даже если раз в час, то посчитай сколько времени понадобится тебе для достижения 100000

Минут 10-15, я это гарантирую.

UVV ★★★★★
(07.10.13 17:22:52 MSK) автор топика

Ответ на: комментарий от tailgunner 07.10.13 17:19:17 MSK

В момент упаковки логов создает неравномерную нагрузку на систему. Кривая схема перемиенования фалов для циркулярного логирования. Бедные возможности по заданию условий какие файлы упаковать.

vromanov ★★★
(07.10.13 17:23:52 MSK)

Ссылка

логи пиши через syslog, дальше забота админа как и куда они будут складываться, архивироваться, удалятся. А то понастроят своих велосипедов, потом иди поддерживай этот зоопарк.

~~sdio~~ ★★★★★
(07.10.13 17:26:59 MSK)

Ответ на: комментарий от sdio 07.10.13 17:26:59 MSK

понастроят своих велосипедов, потом иди поддерживай этот зоопарк.

+1 (хотя я ни разу не админ).

tailgunner ★★★★★
(07.10.13 17:28:14 MSK)

Ссылка

Ответ на: комментарий от UVV 07.10.13 17:22:52 MSK

Один файл будет создаваться каждые 9 мс? You are doing it wrong

~~vertexua~~ ★★★★★
(07.10.13 17:32:06 MSK)

Ответ на: комментарий от vertexua 07.10.13 17:32:06 MSK

Значит немного преувеличил, 4к за 2 минуты выходит примерно.

UVV ★★★★★
(07.10.13 17:36:05 MSK) автор топика

Ответ на: комментарий от UVV 07.10.13 17:36:05 MSK

4к за 2 минуты выходит примерно.

Кажды 30мс новый файл? Странные логи.

tailgunner ★★★★★
(07.10.13 17:41:46 MSK)

Ответ на: комментарий от tailgunner 07.10.13 17:41:46 MSK

tags: [рукожопие]

☺

~~Anon~~
(07.10.13 17:43:23 MSK)

Ссылка

Ответ на: комментарий от UVV 07.10.13 17:36:05 MSK

Ну серьезно, скажи нам зачем так уж много файлов

~~vertexua~~ ★★★★★
(07.10.13 18:02:09 MSK)

Ответ на: комментарий от vertexua 07.10.13 18:02:09 MSK

Там логи на все случаи жизни, в релизе они выключены (пока), нужны скорее для отладки. Я взял наихудший случай (когда включены логи всех компонентов), в общем случае их будет, естественно, меньше.

UVV ★★★★★
(07.10.13 18:14:51 MSK) автор топика

Ответ на: комментарий от UVV 07.10.13 18:14:51 MSK

А, пф. Так они же в разных папках должны лежать

~~vertexua~~ ★★★★★
(07.10.13 18:26:02 MSK)

Ссылка

Ответ на: комментарий от UVV 07.10.13 18:14:51 MSK

Какая-то жесть...

У нас сейчас в продакшене пишется в среднем где-то 4500 строк лога в секунду. syslog просто сдохнет скорее всего на таком объеме. У нас это нормальный режим эксплуатации, можно уровень логирования еще и поднять.

vromanov ★★★
(07.10.13 18:26:04 MSK)

Ответ на: комментарий от sdio 07.10.13 17:26:59 MSK

Вы тестировали сколько сообщений в секунду может переварить syslog и как это сказывается на производительности системы?

vromanov ★★★
(07.10.13 18:28:31 MSK)

Ответ на: комментарий от vromanov 07.10.13 18:26:04 MSK

Какая-то жесть...

В чём заключаеться жесть, если у тебя практически то же самое?

UVV ★★★★★
(07.10.13 18:30:37 MSK) автор топика

Ответ на: комментарий от UVV 07.10.13 18:30:37 MSK

Наверное, у него файлы не каждые 30мс создаются.

tailgunner ★★★★★
(07.10.13 18:32:12 MSK)

Ссылка

Ответ на: комментарий от UVV 07.10.13 18:14:51 MSK

lttng?

vasily_pupkin ★★★★★
(07.10.13 18:40:19 MSK)

Ссылка

Ответ на: комментарий от vromanov 07.10.13 18:28:31 MSK

Да. Вас какой порядок чисел интересует?

В данную минуту squid пишет свой лог и параллельно в сислог: 600 строк (сообщений) в секунду.

 load average: 0.12, 0.16, 0.11
Tasks: 403 total,   1 running, 402 sleeping,   0 stopped,   0 zombie
Cpu0  :  1.3%us,  1.0%sy,  0.0%ni, 96.0%id,  0.0%wa,  0.0%hi,  1.7%si,  0.0%st
<SKIP>
Cpu7  :  0.0%us,  0.0%sy,  0.0%ni,100.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:   8175136k total,  8124952k used,    50184k free,    47412k buffers
Swap: 10223608k total,   237824k used,  9985784k free,  6869984k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND           
24433 squid     15   0  648m 595m 2476 S  3.3  7.5   1212:17 squid

/proc/cpuinfo: model name      : Intel(R) Xeon(R) CPU           E5430  @ 2.66GHz



Лог однодневный (с 00:00 -- сейчас ~19:00)

$ ls -lh /var/log/squid/access.log
-rw-r----- 1 squid squid 4.4G Oct  7 19:00 /var/log/squid/access.log

$ wc -l /var/log/squid/access.log
30985669 /var/log/squid/access.log

~~sdio~~ ★★★★★
(07.10.13 19:57:41 MSK)
Последнее исправление: sdio 07.10.13 20:00:21 MSK (всего исправлений: 1)

Ответ на: комментарий от sdio 07.10.13 19:57:41 MSK

В данную минуту squid пишет свой лог и параллельно в сислог: 600 строк (сообщений) в секунду.

Маловато будет... Раз бы в 20 побольше.

UVV ★★★★★
(07.10.13 22:17:07 MSK) автор топика

Ответ на: комментарий от UVV 07.10.13 18:30:37 MSK

У нас лог из разных процессов сначала пишется в циркулярный буффер в разделяемой памяти. Есть отдельная утилита (ncurses), которая позволяет просматривать содержимое этого буффера с фильтрацией по уровню, источнику, с поиском, раскраской цветами итд. Есть аналог tail -f также с фильтрацией, который можно напустить на этот буфер. Есть сервис, который пишет содержимое буфера на диск, сразу его запаковывая и ротируя. Жрет он при этом меньше процента CPU. В общем этот сервис можно остановить на некоторе время и запустить снова. Если буффер не переполнился, то ничего не теряется.

vromanov ★★★
(07.10.13 22:48:45 MSK)

Ответ на: комментарий от vromanov 07.10.13 22:48:45 MSK

А что имеется в виду под ратацией? Я так понимаю, что она осуществляется все время (равномерно), раз к logrotate была претензия, что он не равномерно нагружает сервер.

anonymous
(07.10.13 23:03:23 MSK)

Ответ на: комментарий от vromanov 07.10.13 22:48:45 MSK

А что будет с логами, если сервис пишущий содержимое буфера на диск по какой-нибудь пречине упадет в процессе упаковки?

anonymous
(07.10.13 23:06:10 MSK)

Ответ на: комментарий от sdio 07.10.13 19:57:41 MSK

А зачем при такой нагрузке access.log заполнять? Сделай его FIFO, да читай на лету программкой, которая трафик считает, сохраняя более сжатые данные (только то, что нужно, а не полную историю).

~~Anon~~
(07.10.13 23:08:25 MSK)

Ссылка

Ответ на: комментарий от sdio 07.10.13 19:57:41 MSK

А у нас за теже 19 часов 3.8 гига ЗАПАКОВАННЫХ логов. Или 34 гига распакованных. Плюс у нас по логам в онлайне рисуются графики количества разных сообщений по уровням.

vromanov ★★★
(07.10.13 23:32:31 MSK)

Ответ на: комментарий от UVV 07.10.13 22:17:07 MSK

так сервер и не нагружен вовсе. я же не зря его загрузку показал

~~sdio~~ ★★★★★
(07.10.13 23:38:37 MSK)

Ответ на: комментарий от anonymous 07.10.13 23:06:10 MSK

Он будет перезапущен ватчдогом. Также, т.к. все пишется в циркулярный буффер, то пока не будет преполнен это буфер ничего теряться не будет. Обычно этого буфера хватает на 10-15 минут (зависит от нагрузки и размера оперативки).

vromanov ★★★
(07.10.13 23:49:07 MSK)

Похожие темы