LINUX.ORG.RU
ФорумAdmin

Server Troubleshooting

 ,


0

1

Приветствую, уважаемое комюнити!

Прошу подсказать, разобраться в проблеме:

на днях перестал отвечать мой dedicated server у провайдера. Провайдер посоветовал сделать harware test, тест был успешно пройден, железо якобы в порядке. После чего провайдер поднял ручки и сказал, что дальше не мои проблемы.

Я загрузился в recovery console, подмапил raid раздел и стал изучать логи. Обнаружилось, что


/var/log/syslog


был оборван на полустрочке. Тоже самое и сдругим логом


/var/log/auth.log


отмонтировав раздел, был сделан fsck - ничего страшного небыло найдено.
В остальных логах все вроде выглядит обыденно.

Отсюда вопрос, что могло послужить причной отказа? Что могло оборвать запись в лог на полуслове? Внезапное отсутствие электроэнергии? Возможен ли сбой файловой системы с такими последствиями? (ext4)

За ранее оч благодарен!



Последнее исправление: cetjs2 (всего исправлений: 2)

1. syslog и auth.log - записи оборвались на одном и том же времени?
2. «В остальных логах все вроде выглядит обыденно.» - Так в них писалось, что-то по времени после того как перестало записываться в syslog и auth.log? И вообще что-то записывалось на диск?
Если по по пункту 1. ответ да, а по п.2. ответ нет. - то с большей вероятностью это железная проблема которая включает и сбой питания, т.е. не обязательно что железка умирает.

Если софтверный рэйд, то я сталкивался со сбоями когда раздел на нем внезапно становился readonly, причем рандомно, мог например 2-й и 3-й раздел, после ребута все работает потом внезапно например только 4-й. Правда во всех случаях кроме одного в результате оказывалось виновато железо, а точнее харды, несмотря на идеальный смарт.
Единственный случай когда я не нашел объяснения, решился копированием с раздела данных, форматированием и заливкой данных назад.

anc ★★★★★
()
Ответ на: комментарий от anc

Да,записи оборвались в одно и тоже время.

После этого времени логи больше не писались.

Т.е. это был все-таки не внутрисистемный сбой,а сбой за пределами операционки-железо..свет и тд..?

kbu
() автор топика
Ответ на: комментарий от kbu

да можт у провайдера свет скакнул, а он теперь решил в отказ чтоб sla не нарушать. Кстати хз что будет в логе если ведро заглохнет. Но думаю все-таки что-то должно дописать

upcFrost ★★★★★
()
Ответ на: комментарий от kbu

Провайдер посоветовал сделать harware test, тест был успешно пройден, железо якобы в порядке. После чего провайдер поднял ручки и сказал, что дальше не мои проблемы.

Кстати, погоди.... а что, бесперебойника на дедике нету??? О_о подключенного к системе мониторинга, обеспечивающего graceful shutdown в случае жопы... Что это за провайдер?

upcFrost ★★★★★
()
Ответ на: комментарий от upcFrost

По поводу бесперебойника к сожаления ничего не могу сказать...провайдер strato.de ...

kbu
() автор топика
Ответ на: комментарий от kbu

Т.е. это был все-таки не внутрисистемный сбой,а сбой за пределами операционки-железо..свет и тд..?

Да, очень похоже на это. Наблюдал такое при железных сбоях не раз.

anc ★★★★★
()
Ответ на: комментарий от upcFrost

Кстати хз что будет в логе если ведро заглохнет. Но думаю все-таки что-то должно дописать

Необязательно, при железных сбоях будет именно так. Т.е на экране кернел паник, а в логах оборванные записи.

anc ★★★★★
()
Ответ на: комментарий от upcFrost

Кстати, погоди.... а что, бесперебойника на дедике нету???

Даже если и есть.
1. Мог быть не подключенным к серваку (мониторинг), отработать на батарейке и сдохнуть
2. Не всегда спасает (ман переходные процессы и не только)
3. Проблемы с БП сервера.

anc ★★★★★
()
Ответ на: комментарий от anc

пров дедика обычно ответственен именно за железные сбои, в т.ч. за бп, мониторинг (со стороны железа) и прочее. Судя по симптомам ТСа - сбой как раз где-то на уровне железа

upcFrost ★★★★★
()

Самое смешное произошло сегодня - у меня есть еще один дедик у этого же провайдера,купил за пару дней до сбоя и на него же перебросил все сервисы после сбоя. Так вот сегодня утром опять проблемы.. новый сервер опять вылетел..на этот раз тест железа показал ошибки. В письме пров сказал что заменили мать - подключайтесь.. пробую - ни фига..звоню,опять отправляют чела смотреть что там...в итоге опять пишут-сервер доступен...пока по ссх не зашел...посмотрю что там в логах...но сегодня уже приобрел другой сервак, у другого прова-будем туда уходить...

kbu
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.