LINUX.ORG.RU

Что могло сдохнуть в серваке?

 , ,


1

3

У меня вчера поздно ночью сдох домашний сервак. Он представляет собой неттоп, подключенный по USB 3.0 к дисковому накопителю. В самом неттопе тоже жесткий диск, с которого он и работает. Дисковый накопитель в порядке, я в этом уже убедился, подключив его к ноуту.
Ничто не предвещало беды. Я смотрел с этого дискового накопителя сериал по локалке, как всегда это делал. Вдруг картинка замерла, по ssh к серваку я подключиться уже не смог. Свет при этом не мигал абсолютно.
Пошел к серваку, выключил его и включил снова. И даже смог на короткое время подключиться по ssh. И службы на серваке заработали. У меня есть на нем небольшой bash-скрипт, который врубает rtorrent после перезагрузки, т.к сам rtorrent это сделать не может, и я уже приучился каждый раз его запускать вручную. Врубил этот скрипт и на этот раз. И тут посыпались какие-то ошибки в файловой системе и меня снова дисконнектнуло.
Последующие попытки подключиться не увенчались успехом. Ни одна служба недоступна. При этом сервак пингуется под тем же статическим IP, который я ему дал.
Что на ваш взгляд это может быть?
1. Сервак весь сдох целиком?
2. Аппаратно сдох жесткий диск и его придется менять?
3. Программно запортилась файловая система и дело обойдется только переустановкой?

Извините, что приходится гадать на кофейной гуще, но дело еще в том, что я куда-то посеял HDMI->miniHDMI кабель, с помощью которого он подключается к монитору. А т.к сегодня утро понедельника, то в магазин за новым кабелем придется ехать только после работы, я изведусь. Уже извелся, спал всего какой-то 1 час. Поэтому помогите пожалуйста, предположите, что все же произошло с моим сервером? Меня как-то обнадеживает, что он все же пингуется.

★★★★★

Ты предлагаешь делать ставки? Ищи переходник, подключай к монитору и клавиатуре

router ★★★★★
()

Банально переткнуть хард для начала. Контакты вполне могли загрязниться. До кучи проверь ФС, подключив хард к другой машине.

У меня похожая ситуация с кубитраком была, но он сыпал ошибками при попытке смонтировать rootfs с харда.

Отключил диск, прогнал fsck, подключил назад, запустил. Ошибки ФС были, но не смертельные.

Radjah ★★★★★
()
Последнее исправление: Radjah (всего исправлений: 1)

Смотрим смарт. Если все ок - делаем fsck. Если не ок - делаем бекап и идем за новым хардом или флешкой или с чего он у тебя там работает.

slowpony ★★★★★
()

Вангую, что предыдущий оратор прав.

ps1h ★★★
()
Ответ на: комментарий от Rinaldus

Я упустил, livecd уже вне закона ?

Deleted
()
Ответ на: комментарий от Radjah

В общем, я так и не понял, что с ним произошло. Главное, сам сервак жив, жесткий диск жив и данные на нем живы.
Подключил я его к телевизору и попробовал загрузить. У меня на нем стоит Ubuntu 16.04, поэтому systemd доходил до строчки

mounting /home
mounted /home
и дальше вис секунд на 30. Потом строки быстро пробегали, я не успевал заметить и он вываливался в emergency mode. Тогда я загрузил его с LiveUSB и проверил смарт жесткого диска. Он оказался в порядке. Затем я каждый раздел на жестком диске пропустил через fsck -f и еще потом для верности через fsck -y. Я так и не понял, сообщает ли он о наличии ошибок, которые удалось исправить или нет. Затем я загрузился обратно с внутреннего жесткого диска и прочитал в журнале systemd, что он выдавал несколько ошибок при монтировании разделов дискового накопителя, который я естественно отключил перед тем, чтобы отнести неттоп к телевизору на диагностику. Ну формально это ошибки, но это ведь не повод вываливаться из-за такой ерунды в emergency mode. Так или иначе, я закомментировал соответствующие строки в /etc/fstab, и после этого он загрузился в нормальном режиме, а не в emergency mode. Потом я его отнес на его место, подключил дисковый накопитель, все как прежде. Зашел на него по SSH, раскомментировал строки по монтированию разделов дискового накопителя, убедился по «mount -a», что он ошибок не выдает и перезагрузил его. Он загрузился нормально. И все службы тоже загрузились нормально.
Но я так и не понял, что это было? оО Я утром раз 5 его перезагружал с включенным дисковым накопителем, он работать не хотел категорически!

Rinaldus ★★★★★
() автор топика

Похоже на нестабильное питание. Кондёры? Оно обычно так и выглядит. Включается, работает несколько секунд, потом начинает глючить. И так пока не сгорит совсем.

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

За пару дней до этого несколько раз мигал свет и он отключался. Я его включал, он работал нормально. А спустя несколько дней вот такой сбой. Может ли он быть таким отложенным?

Rinaldus ★★★★★
() автор топика
Ответ на: комментарий от Rinaldus

За пару дней до этого несколько раз мигал свет и он отключался. Я его включал, он работал нормально. А спустя несколько дней вот такой сбой. Может ли он быть таким отложенным?

Возможно пробило какой нибудь элемент и он начал деградировать. У меня так роутер дох. Сначала зависал раз в неделю, но после перезагрузки оживал. Потом стал отваливаться внешний винт, перегружать приходилось чаще, причём пускался он не сразу, а чуть погодя. А потом он потух и начал плохо пахнуть :)

Jameson ★★★★★
()

предположите, что все же произошло с моим сервером?

Голосование!? :)

посыпались какие-то ошибки в файловой системе

Либо шлейф, либо диск менять придётся...

backbone ★★★★★
()
Ответ на: комментарий от Rinaldus

фс твоя журналируемая от перебоев питания посыпалась немного вот и всего делов

системд неадекватно реагирует на фстаб, монтируй лучше как-то иначе

smilessss ★★★★★
()
Ответ на: комментарий от smilessss

Можно башевским скриптом монтировать вручную, после каждой перезагрузки сервера. Как еще иначе?

Rinaldus ★★★★★
() автор топика
Ответ на: комментарий от Rinaldus

Если ФС из fstab не смонтировалась - это серьезный сбой при загрузке. Так что всё правильно вывалилось.

Radjah ★★★★★
()
Ответ на: комментарий от Radjah

Снова все грохается. Проснулся утром - сервак снова не работает. Включил заново, вроде нормально. Вот только что буквально на моих глазах:

rinaldus@myservak /tmp $ sudo systemctl restart madsonic
-bash: /usr/bin/sudo: Ошибка ввода/вывода
rinaldus@myservak /tmp $ sudo systemctl restart madsonic
-bash: /usr/bin/sudo: Ошибка ввода/вывода
rinaldus@myservak /tmp $ ls
ls: command not found
rinaldus@myservak /tmp $ ls
ls: command not found
rinaldus@myservak /tmp $ exit
выход
Connection to ******* closed.
rinaldus@home ~ $ ssh *******
ssh_exchange_identification: read: Connection reset by peer
rinaldus@home ~ $ ssh -v *******
OpenSSH_7.3p1-hpn14v11, OpenSSL 1.0.2j  26 Sep 2016
debug1: Reading configuration data /home/rinaldus/.ssh/config
debug1: /home/rinaldus/.ssh/config line 8: Applying options for *******
debug1: Reading configuration data /etc/ssh/ssh_config
debug1: Connecting to ******* [*********] port ******.
debug1: Connection established.
debug1: identity file /home/rinaldus/.ssh/id_rsa type 1
debug1: key_load_public: No such file or directory
debug1: identity file /home/rinaldus/.ssh/id_rsa-cert type -1
debug1: key_load_public: No such file or directory
debug1: identity file /home/rinaldus/.ssh/id_dsa type -1
debug1: key_load_public: No such file or directory
debug1: identity file /home/rinaldus/.ssh/id_dsa-cert type -1
debug1: key_load_public: No such file or directory
debug1: identity file /home/rinaldus/.ssh/id_ecdsa type -1
debug1: key_load_public: No such file or directory
debug1: identity file /home/rinaldus/.ssh/id_ecdsa-cert type -1
debug1: key_load_public: No such file or directory
debug1: identity file /home/rinaldus/.ssh/id_ed25519 type -1
debug1: key_load_public: No such file or directory
debug1: identity file /home/rinaldus/.ssh/id_ed25519-cert type -1
debug1: Enabling compatibility mode for protocol 2.0
debug1: Local version string SSH-2.0-OpenSSH_7.3p1-hpn14v11
ssh_exchange_identification: read: Connection reset by peer
ЧТО ПРОИСХОДИТ???????????!!!!!!

Rinaldus ★★★★★
() автор топика
Ответ на: комментарий от Rinaldus

Продал аккаунт идиоту, или это какая-то болезнь пятизвёздочных? Вынь из неттопа диск, подключи его к канпутеру, и всё станет понятно.

anonymous
()
Ответ на: комментарий от Rinaldus

А в dmesg есть пачка ошибок SATA? Я так понимаю, что диск подключается не шлейфом, а к колодке на плате, так?

Radjah ★★★★★
()
Ответ на: комментарий от Radjah

Неттоп Intel NUC DM4010WYKH. Жесткий диск в него мне подключали в магазине, но я посмотрел некоторые видео и судя по ним, он подключается туда без шлейфов.

Rinaldus ★★★★★
() автор топика
Ответ на: комментарий от Rinaldus

Уже остаётся только на разъем подключения грешить, если он как в ноутбуках сделан.

Есть еще одна бредовая идея у меня. Подключить диск к компу прямо на SATA без переходников и погонять на нём часов несколько тест на случайное чтение. Только по софту не подскажу. Может всё же хард концы отдаёт таким странным образом.

Radjah ★★★★★
()
Ответ на: комментарий от Radjah

Так все же в жестком диске дело или в самом неттопе? Может купить внешний жесткий диск с USB 3.0, который будет выступать системным?

Rinaldus ★★★★★
() автор топика
Последнее исправление: Rinaldus (всего исправлений: 2)
Ответ на: комментарий от Rinaldus

Знакомые подсказывают, что скорее всего разъем накрывается. Может его банально прогреть надо, чтобы заработал.

Про диск я написал, потому что являюсь счастливым обладателем WD на 640 гигов, который начинает люто тормозить при запуске любого теста из SMART. При этом даже короткий тест может идти часами.

Radjah ★★★★★
()
Ответ на: комментарий от Radjah

Разъем этот на неттопе находится или на самом жестком диске? Я по идее могу сдать неттоп обратно в магазин по гарантии, но дело в том, что они будут проводить экспертизу 40 дней и имеют на это право по закону. Но у меня тогда все эти 40 дней не будет домашнего сервака. Поэтому реально подумываю купить внешний жесткий диск с интерфейсом USB 3.0 и использовать в качестве системного.
Вот только Western Digital покупать что-то расхотелось. Уж больно много появилось отрицательных отзывов на них и все вида «сдох на ровном месте». Прямо как у меня сейчас. И у меня этот жесткий диск тоже Western Digital.

Rinaldus ★★★★★
() автор топика
Последнее исправление: Rinaldus (всего исправлений: 1)
Ответ на: комментарий от Rinaldus

Ну диску тому не первый год уже. :) В основном только WD и стоят у меня.

Я про разъем на материнке. К плате харда разъем чуть ли не приварен. Но хард погонять под нагрузкой всё равно не помешает.

И на правах бреда проверить напругу 5 и 12 вольт на питании.

На счет поддиванного сервака у меня был путь WD MBL -> Cubietruck -> самосборная коробка с miniITX и недопроцессором N3150.

Radjah ★★★★★
()
Ответ на: комментарий от Radjah

Купил внешний жесткий диск и перекопировал на него все данные со старого. Корневой каталог скопировал с помощью tar. Домашний каталог тоже начал было копироваться, но вот тут-то старый жесткий диск опять выдал в каком-то месте «ошибка ввода/вывода» и он вместо /dev/sda стал /dev/sdd, наложив при этом в dmesg кучу ошибок. Пришлось копировать через rsync, на этот раз скопировалось все с первого раза.
Надеюсь, теперь все будет работать нормально, но я успокоюсь только через неделю полностью стабильной работы. Так что тему решенной пока не помечаю.

Rinaldus ★★★★★
() автор топика
Ответ на: комментарий от Rinaldus

Чеки и гарантийный талон тоже далеко не убирай.

Radjah ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.