0

2

Здравствуйте. Слёзно прошу помощи, иначе мне конец.

После обесточивания на блейде попала сеть ,в т.ч. между лезвиями на которых были серверы. На двух блейдах установлен Alt Linux, они объеденные в кластер, на кластере крутится 1С. Крутилась.. . Пропала сеть, пропала связь между лезвиями. Как чинить сервер пока не знаю, но проблема не в этом. Нужно вытащить базу данных из сервера 1С. Сервер не запускается, выдаёт ошибку «cluster not reade - no quorum? (500)». Оно и понятно, первый хост не видит второй, т.к. между ними пропала сеть (я могу зайти на любую из нод). В общем, в виртулаьной машине на обоих хостах можно увидеть образы vm-101-disk-1.raw. Подскажите пожалуйста, как извлечь из этих образов данные? Пробовал открыть в Linux - пишет: «Unable to mount NODE01:VM Error mounting /dev/sdd at /media/mint/NODE1:VM: mount(2) system call failed: Transport endpoint not connet»

Спасибо!

←	OpenWrt на роутере не могу поменять значения с 0 на 1

OpenSUSE Leap 15.4 + XEN + Dell PowerEdge R720 - CPU Fans

→

Сделай полный бэкап всего, да как-нибудь так, чтобы ты его не запорол
Если хочешь, чтобы сеть работала, чини сеть
Если хочешь узнать, как монтировать разделы изнутри raw-образов — почитай про это
Если хочешь конкретики, спрашивай конкретику

А то пока «памагити, у меня пять детей голодных, спустило шину. Оно и понятно, из неё гвоздь торчит вот-такенный, но вопрос не в этом. Как открутить гайки, на которых радиатор крепится, а то они заржавели че-то?».

t184256 ★★★★★
(27.02.23 17:30:31 MSK)

Ответ на: комментарий от t184256 27.02.23 17:30:31 MSK

У меня на двух нодах используется один и тот же виртуальный диск (судя по названию). Если я скачаю образы с обеих нод, как мне объединить их в полноценный или чем-то открыть, чтобы извлечь данные?

ogankvik
(27.02.23 17:50:03 MSK) автор топика

Обратись к системному администоатору, не надо самому.

Anoxemian ★★★★★
(27.02.23 17:54:49 MSK)

Ответ на: комментарий от ogankvik 27.02.23 17:50:03 MSK

У тебя ноды зеркальные, зачем тебе «объединять диск». Стащи его с любой ноды и работай с ним. Даже если они успели уйти в рассинхрон - ничего страшного, всё равно у тебя база битая из за некорректного выключения и её нужно восстанавливать будет. А «объединяя диск» ты рискуешь их оба два запороть, даже если найдёшь способ это сделать.

Jameson ★★★★★
(27.02.23 17:55:18 MSK)

Ответ на: комментарий от Anoxemian 27.02.23 17:54:49 MSK

Я он и есть. Раньше не работал с кластерами. Но вот, случилось

ogankvik
(27.02.23 17:55:44 MSK) автор топика

Ответ на: комментарий от ogankvik 27.02.23 17:55:44 MSK

Сочувствую работодателю.

Anoxemian ★★★★★
(27.02.23 17:56:56 MSK)

Ответ на: комментарий от Jameson 27.02.23 17:55:18 MSK

Скажи пожалуйста, чем мне посмотреть содержимое этого RAW образа? К сожалению, я не могу переместить его на другой сервер, такого просто нет.

ogankvik
(27.02.23 17:57:29 MSK) автор топика

Ответ на: комментарий от ogankvik 27.02.23 17:57:29 MSK

RAW на то и RAW, формат и файловая система внутри может быть абсолютно любая. Тут надо спрашивать у того кто всё это поднимал, или изучать конфиги монтирующей это виртуалки.

Jameson ★★★★★
(27.02.23 18:03:41 MSK)

Ответ на: комментарий от Jameson 27.02.23 18:03:41 MSK

Виртуалка говорит что формат LVM. Сервак обслуживает одна компания, но у них не осталось тех, кто его в своё время настраивал и что теперь делать, они не знают. Бэкапы как оказалось сохранялись прям на кластер, который теперь недоступен

ogankvik
(27.02.23 18:12:52 MSK) автор топика

Ответ на: комментарий от ogankvik 27.02.23 18:12:52 MSK

В качестве виртуалки используется Proxmox Virtual Environment (PVE).

ogankvik
(27.02.23 18:16:04 MSK) автор топика

Ответ на: комментарий от ogankvik 27.02.23 17:57:29 MSK

Ну для начала его нужно забекапить. А смотреть: https://www.linuxunbound.com/2016/07/15/mounting-raw-and-qcow2-images/

Vsevolod-linuxoid ★★★★★
(27.02.23 18:27:00 MSK)

Ответ на: комментарий от ogankvik 27.02.23 18:12:52 MSK

Виртуалка говорит что формат LVM

Ну вот, на другой машине монтируй этот RAW как loop device и натрави на него lvmdiskscan

Сервак обслуживает одна компания, но у них не осталось тех, кто его в своё время настраивал и что теперь делать, они не знают.

Что значит «не знают»? Неустойку платить. У вас ведь контракт есть? Неустойки в нём прописаны? Могли бы за свой счёт обратиться в контору по восстановлению данных, если у самих компетенции не хватает, подкиньте им эту идею. «Мы на знаем что делать, у нас лапки...» идиотизм какой то. Засудите их до потери пульса, вы имеете на это полное право.

Бэкапы как оказалось сохранялись прям на кластер, который теперь недоступен

Гениально. «Мама сказала деньги в бидоне».

Jameson ★★★★★
(27.02.23 18:27:21 MSK)

Образ цепляешь к системе (Linux на твоём ноуте или рабочей машине) через losetup. У тебя появятся loop-устройства, которые уже будет с партициями. И вот оно монтируешь утилитой mount.

https://yandex.ru/search/?text=raw disk losetup mount

А, да, успеха. Не кипеши и не суетись. Сделай копию и работай с копией.

targitaj ★★★★★
(27.02.23 18:27:55 MSK)
Последнее исправление: targitaj 27.02.23 18:42:08 MSK (всего исправлений: 2)

Ответ на: комментарий от Jameson 27.02.23 18:27:21 MSK

Действительно. Если у них есть действующий контракт на обслуживание этого сервера, то этим не ТС должен заниматься. Хотя бы из соображений, что на него не повесили, что он всё сломал.

К слову, ведь по идее можно всё юридически так грамотно оформить, чтобы нанять сейчас за много денег стороннего спеца на время, а потом заставить горе-подрядчика за всё заплатить.

Хотя конечно не исключено, что контракт был на разовую настройку ПО, а постоянное обслуживание только по железу. Тогда ой, не выйдет ничего.

Vsevolod-linuxoid ★★★★★
(27.02.23 18:29:33 MSK)
Последнее исправление: Vsevolod-linuxoid 27.02.23 18:35:49 MSK (всего исправлений: 3)

Нужно найти того, кто сделал «кластер» из двух систем и /дальше неразборчиво/.

thesis ★★★★★
(27.02.23 18:32:50 MSK)

Ответ на: комментарий от Vsevolod-linuxoid 27.02.23 18:29:33 MSK

Я так понимаю он сейчас бегает в мыле и на него орут «давай давай доставай доставай базу базу прямщас, ты же программист». И в то что этим ващет не он должен заниматься никто не вникает. Надобно бы внятно разъяснить начальству что раз заключён контракт на обслуживание и сопровождение — бегать в мыле и рвать жопу должны исполнители, а не заказчик. И «мы не знаем, мы не можем» это неисполнение условий контракта и дорога в суд. Что тоже следует объяснить менеджменту исполнителя, и подкинуть им идею — нанять тех кто может, и из своего кармана им заплатить. Или прогуляться в суд, обрести репутационные потери и потерять клиента.

Параллельно админ может и должен своими силами образ ковырять конечно, но желательно донести мысль что это добровольная инициатива, а не функциональная обязанность, и орать и давить не следует, так же как и карать в случае провала.

Jameson ★★★★★
(27.02.23 18:38:45 MSK)

Ответ на: комментарий от Jameson 27.02.23 18:38:45 MSK

Да, тут вся хрень из-за фактора времени. Интересно, а есть ли в принципе дорогая «скорая помощь» с по-настоящему грамотными админами? Чтобы типа заплатил прямо сейчас тонну денег — и тебе ASAP прибудет на площадку или подключится удаленно мега-спец, что всё разрулит?

Про дорогую я пишу потому, что такое точно не будет дешевым, это уже вообще из области фантастики.

Vsevolod-linuxoid ★★★★★
(27.02.23 18:42:35 MSK)
Последнее исправление: Vsevolod-linuxoid 27.02.23 18:43:33 MSK (всего исправлений: 1)

Ответ на: комментарий от Vsevolod-linuxoid 27.02.23 18:42:35 MSK

Задача на самом деле несложная если понимать что там произошло и как это починить (по сути достаточно просто починить коросинк и оно всё само должно собрать).

no-dashi-v2 ★★
(27.02.23 19:02:43 MSK)

Ответ на: комментарий от Vsevolod-linuxoid 27.02.23 18:42:35 MSK

Спасибо за ответы и сочувствие! Больница закрылась, выгнали. Завтра буду пробовать.

Из дома создам тему в хардварной ветке про сервер, может кто поможет восстановить сеть и это решило бы проблему.

По поводу нашего саппорта - как есть..

ogankvik
(27.02.23 19:04:27 MSK) автор топика

Ответ на: комментарий от no-dashi-v2 27.02.23 19:02:43 MSK

Я так понимаю там что то аппаратное накрылось и ремонту подлежит сама железка.

Jameson ★★★★★
(27.02.23 19:08:01 MSK)

Я не в теме, но mount, offset и -t ? Может сначала раздел за’dd’шить и каким-нить fsck прогнать?

NeWT
(27.02.23 19:55:49 MSK)

Ответ на: комментарий от Jameson 27.02.23 19:08:01 MSK

Вот он сам пишет - «оно и понятно, первый хост не видит второй, т.к. между ними пропала сеть (я могу зайти на любую из нод)» - то есть сеть у него есть, просто у него настройки кластерной сети походу слетели.

no-dashi-v2 ★★
(27.02.23 20:12:56 MSK)

Ответ на: комментарий от thesis 27.02.23 18:32:50 MSK

Да у него вообще каша. В одной куче блейды, альт, проксмокс, кластер из двух участников и прочие кони. Чел небось не знает что такое «блейд», не говоря уже про остальное.

targitaj ★★★★★
(27.02.23 20:18:19 MSK)

Ответ на: комментарий от ogankvik 27.02.23 19:04:27 MSK

Как выглядит проблема с аппаратной стороны: AQUARIUS SERVER N90 X60. Перестала работать сеть.

ogankvik
(27.02.23 21:34:52 MSK) автор топика

Сломалась одна нода, и лег весь кластер?
Это какой-то очень хреновый кластер. Даже менее надежный, чем одна машина.

bigbit ★★★★★
(27.02.23 22:34:13 MSK)

Ответ на: комментарий от bigbit 27.02.23 22:34:13 MSK

На блейде перестала работать сеть, в т.ч. коммутация между нодами. Ноды не видят друг друга, а без второй ноды запуск сервера невозможен или, я не знаю как это сделать.

ogankvik
(27.02.23 22:46:14 MSK) автор топика

Ответ на: комментарий от bigbit 27.02.23 22:34:13 MSK

Блейд это. Вот такое у него слабое место, внутренний свитч называется, он не дублирован. Но по хорошему, по правильному, те кто такое эксплуатируют должны это знать и иметь запасной. При наличии резерва весь простой с ремонтом сводится к замене модуля.

Jameson ★★★★★
(27.02.23 22:53:59 MSK)

Ответ на: комментарий от Jameson 27.02.23 22:53:59 MSK

А какого модуля? У меня их два. В одном 10 портов, в другом один. Догадываюсь что тот, в котором один? https://ibb.co/GchnZhL

ogankvik
(27.02.23 23:04:36 MSK) автор топика

Ответ на: комментарий от ogankvik 27.02.23 23:04:36 MSK

Я конкретно за этот блейд не скажу, я его вживую не видел. Похоже что он... Но во первых у тебя должна быть документация, а во вторых у них у всех есть rs232, я так понимаю это аппаратная консоль, судя по маркировке. Так что я бы поподключался и посмотрел изнутри, как оно там и ваще...

Jameson ★★★★★
(27.02.23 23:11:47 MSK)

Ответ на: комментарий от Jameson 27.02.23 22:53:59 MSK

То есть как это не дублирован? В том же HP c7000 два заменяемых свитча (сетевых или FibreChannel). Каждый блэйд втыкается двумя портами в каждый свитч.

Сломаться может midplane, но это значит, что всему шасси кирдык. Оно ломается очень редко, т.к. на нем нет активных элементов, только распайка.

bigbit ★★★★★
(27.02.23 23:27:52 MSK)
Последнее исправление: bigbit 27.02.23 23:28:21 MSK (всего исправлений: 1)

Ответ на: комментарий от ogankvik 27.02.23 23:04:36 MSK

Раз у тебя 2 модуля, на серверах должно быть по 2 сетевых интерфейса минимум (для полноразмерного блейда - 4), объединенных в бондинг, чтобы авария одного модуля никак не влияла.

Кинь вывод команды «ip a s» - что там вообще с сетевыми интерфейсами, есть ли бондинг?

bigbit ★★★★★
(27.02.23 23:48:04 MSK)
Последнее исправление: bigbit 28.02.23 00:06:14 MSK (всего исправлений: 2)

Ответ на: комментарий от ogankvik 27.02.23 23:04:36 MSK

То, что на фото - это все, что у тебя есть? Других модулей нет?

Тогда у тебя всего один сетевой модуль (тот, который горит оранжевым). А тот, в котором всего один порт RJ-45 - это управляющий модуль всего шасси, на него вообще пофиг.

Раз шасси покупали в такой комплектации (с одним модулем вместо двух), значит, простой для этой системы не критичен. Глупо подпрыгивать из-за того, что железка сломалась.

bigbit ★★★★★
(28.02.23 16:47:04 MSK)

Ответ на: комментарий от bigbit 28.02.23 16:47:04 MSK

Парни, спасибо вам огромной за помощь и участие! Проблема решена.

Пришел человек, подключился по com`у к управляющему модулю, увидел в консоли его айпи адрес. Мы подключились, ОС сказал что сетевой модуль дохлый. Я добыл несколько USB сетевых карт ( https://i.ibb.co/SrcxQKQ/viber-2023-02-28-20-27-23-743.jpg ), перенастроили бридж и вуаля, кластер заработал, 1С запустилась ;)

ogankvik
(28.02.23 21:14:46 MSK) автор топика

Ответ на: комментарий от ogankvik 28.02.23 21:14:46 MSK

Таки время подумать за дешовый и сердитый бэкап сего ынтерпрайза. Чтобы при очередном подземном стуке с ынтерпрайз-сетапом не оказаться у разбитого корыта, да.

x22 ★
(28.02.23 21:41:55 MSK)

Ответ на: комментарий от x22 28.02.23 21:41:55 MSK

Когда сломается SAS’овский модуль, подключит USB-диски :-)

bigbit ★★★★★
(28.02.23 22:13:27 MSK)

Ответ на: комментарий от bigbit 28.02.23 22:13:27 MSK

Или для базы данных и 1С вообще достаточно одного невыключаемого PC у бюстгалтерши тети Клавы. Таки что-то поцказывает, что результат будет примерно такой же.

x22 ★
(28.02.23 22:40:44 MSK)

Ответ на: комментарий от x22 28.02.23 22:40:44 MSK

Или для базы данных и 1С вообще достаточно одного невыключаемого PC у бюстгалтерши тети Клавы. Таки что-то поцказывает, что результат будет примерно такой же.

но у гены не было бы яхты )

kindof ★
(28.02.23 23:13:19 MSK)

Ответ на: комментарий от kindof 28.02.23 23:13:19 MSK

А у ТС вместо геморроя с блэйдами был бы легкий флирт с отверткой и клавой тети Клавы, да.

x22 ★
(28.02.23 23:27:14 MSK)

Ответ на: комментарий от ogankvik 28.02.23 21:14:46 MSK

Молодец! Повезло, что там просто бридж.

targitaj ★★★★★
(28.02.23 23:33:51 MSK)
Последнее исправление: targitaj 28.02.23 23:34:11 MSK (всего исправлений: 1)

Ответ на: комментарий от bigbit 28.02.23 22:13:27 MSK

Когда сломается SAS’овский модуль, подключит USB-диски :-)

причем usb 1.1 :) Ну и когда погорят мозги, отправит своп на эти диски :)

anc ★★★★★
(01.03.23 13:01:56 MSK)

А там нет способа временно понизить кворум до одной ноды? И второй сервак отрубить для гарантии чтоб сплит не пошёл.

Ну и кластер из двух нод это не кластер, надёжность ниже чем у одной ноды

upcFrost ★★★★★
(01.03.23 15:38:38 MSK)
Последнее исправление: upcFrost 01.03.23 15:38:52 MSK (всего исправлений: 1)

Ответ на: комментарий от anc 01.03.23 13:01:56 MSK

Ну и когда погорят мозги,

Чьи?

x22 ★
(01.03.23 19:12:50 MSK)

Ответ на: комментарий от x22 01.03.23 19:12:50 MSK

Я про те которые в сервере, их ещё иногда ОЗУ кличут. А у вас были какие-то другие варианты?

anc ★★★★★
(01.03.23 19:48:19 MSK)

←	OpenWrt на роутере не могу поменять значения с 0 на 1

Admin

OpenSUSE Leap 15.4 + XEN + Dell PowerEdge R720 - CPU Fans

→

Похожие темы