LINUX.ORG.RU
ФорумAdmin

Виртуализация. Как извлечь данные из кластера, если одна из двух нод недоступна?

 , , ,


0

2

Здравствуйте. Слёзно прошу помощи, иначе мне конец.

После обесточивания на блейде попала сеть ,в т.ч. между лезвиями на которых были серверы. На двух блейдах установлен Alt Linux, они объеденные в кластер, на кластере крутится 1С. Крутилась.. . Пропала сеть, пропала связь между лезвиями. Как чинить сервер пока не знаю, но проблема не в этом. Нужно вытащить базу данных из сервера 1С. Сервер не запускается, выдаёт ошибку «cluster not reade - no quorum? (500)». Оно и понятно, первый хост не видит второй, т.к. между ними пропала сеть (я могу зайти на любую из нод). В общем, в виртулаьной машине на обоих хостах можно увидеть образы vm-101-disk-1.raw. Подскажите пожалуйста, как извлечь из этих образов данные? Пробовал открыть в Linux - пишет: «Unable to mount NODE01:VM Error mounting /dev/sdd at /media/mint/NODE1:VM: mount(2) system call failed: Transport endpoint not connet»

Спасибо!

  1. Сделай полный бэкап всего, да как-нибудь так, чтобы ты его не запорол
  2. Если хочешь, чтобы сеть работала, чини сеть
  3. Если хочешь узнать, как монтировать разделы изнутри raw-образов — почитай про это
  4. Если хочешь конкретики, спрашивай конкретику

А то пока «памагити, у меня пять детей голодных, спустило шину. Оно и понятно, из неё гвоздь торчит вот-такенный, но вопрос не в этом. Как открутить гайки, на которых радиатор крепится, а то они заржавели че-то?».

t184256 ★★★★★
()
Ответ на: комментарий от t184256

У меня на двух нодах используется один и тот же виртуальный диск (судя по названию). Если я скачаю образы с обеих нод, как мне объединить их в полноценный или чем-то открыть, чтобы извлечь данные?

ogankvik
() автор топика
Ответ на: комментарий от ogankvik

У тебя ноды зеркальные, зачем тебе «объединять диск». Стащи его с любой ноды и работай с ним. Даже если они успели уйти в рассинхрон - ничего страшного, всё равно у тебя база битая из за некорректного выключения и её нужно восстанавливать будет. А «объединяя диск» ты рискуешь их оба два запороть, даже если найдёшь способ это сделать.

Jameson ★★★★★
()
Ответ на: комментарий от ogankvik

RAW на то и RAW, формат и файловая система внутри может быть абсолютно любая. Тут надо спрашивать у того кто всё это поднимал, или изучать конфиги монтирующей это виртуалки.

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

Виртуалка говорит что формат LVM. Сервак обслуживает одна компания, но у них не осталось тех, кто его в своё время настраивал и что теперь делать, они не знают. Бэкапы как оказалось сохранялись прям на кластер, который теперь недоступен

ogankvik
() автор топика
Ответ на: комментарий от ogankvik

Виртуалка говорит что формат LVM

Ну вот, на другой машине монтируй этот RAW как loop device и натрави на него lvmdiskscan

Сервак обслуживает одна компания, но у них не осталось тех, кто его в своё время настраивал и что теперь делать, они не знают.

Что значит «не знают»? Неустойку платить. У вас ведь контракт есть? Неустойки в нём прописаны? Могли бы за свой счёт обратиться в контору по восстановлению данных, если у самих компетенции не хватает, подкиньте им эту идею. «Мы на знаем что делать, у нас лапки...» идиотизм какой то. Засудите их до потери пульса, вы имеете на это полное право.

Бэкапы как оказалось сохранялись прям на кластер, который теперь недоступен

Гениально. «Мама сказала деньги в бидоне».

Jameson ★★★★★
()

Образ цепляешь к системе (Linux на твоём ноуте или рабочей машине) через losetup. У тебя появятся loop-устройства, которые уже будет с партициями. И вот оно монтируешь утилитой mount.

https://yandex.ru/search/?text=raw disk losetup mount

А, да, успеха. Не кипеши и не суетись. Сделай копию и работай с копией.

targitaj ★★★★★
()
Последнее исправление: targitaj (всего исправлений: 2)
Ответ на: комментарий от Jameson

Действительно. Если у них есть действующий контракт на обслуживание этого сервера, то этим не ТС должен заниматься. Хотя бы из соображений, что на него не повесили, что он всё сломал.

К слову, ведь по идее можно всё юридически так грамотно оформить, чтобы нанять сейчас за много денег стороннего спеца на время, а потом заставить горе-подрядчика за всё заплатить.

Хотя конечно не исключено, что контракт был на разовую настройку ПО, а постоянное обслуживание только по железу. Тогда ой, не выйдет ничего.

Vsevolod-linuxoid ★★★★★
()
Последнее исправление: Vsevolod-linuxoid (всего исправлений: 3)
Ответ на: комментарий от Vsevolod-linuxoid

Я так понимаю он сейчас бегает в мыле и на него орут «давай давай доставай доставай базу базу прямщас, ты же программист». И в то что этим ващет не он должен заниматься никто не вникает. Надобно бы внятно разъяснить начальству что раз заключён контракт на обслуживание и сопровождение — бегать в мыле и рвать жопу должны исполнители, а не заказчик. И «мы не знаем, мы не можем» это неисполнение условий контракта и дорога в суд. Что тоже следует объяснить менеджменту исполнителя, и подкинуть им идею — нанять тех кто может, и из своего кармана им заплатить. Или прогуляться в суд, обрести репутационные потери и потерять клиента.

Параллельно админ может и должен своими силами образ ковырять конечно, но желательно донести мысль что это добровольная инициатива, а не функциональная обязанность, и орать и давить не следует, так же как и карать в случае провала.

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

Да, тут вся хрень из-за фактора времени. Интересно, а есть ли в принципе дорогая «скорая помощь» с по-настоящему грамотными админами? Чтобы типа заплатил прямо сейчас тонну денег — и тебе ASAP прибудет на площадку или подключится удаленно мега-спец, что всё разрулит?

Про дорогую я пишу потому, что такое точно не будет дешевым, это уже вообще из области фантастики.

Vsevolod-linuxoid ★★★★★
()
Последнее исправление: Vsevolod-linuxoid (всего исправлений: 1)
Ответ на: комментарий от Vsevolod-linuxoid

Задача на самом деле несложная если понимать что там произошло и как это починить (по сути достаточно просто починить коросинк и оно всё само должно собрать).

no-dashi-v2 ★★
()
Ответ на: комментарий от Vsevolod-linuxoid

Спасибо за ответы и сочувствие! Больница закрылась, выгнали. Завтра буду пробовать.

Из дома создам тему в хардварной ветке про сервер, может кто поможет восстановить сеть и это решило бы проблему.

По поводу нашего саппорта - как есть..

ogankvik
() автор топика
Ответ на: комментарий от Jameson

Вот он сам пишет - «оно и понятно, первый хост не видит второй, т.к. между ними пропала сеть (я могу зайти на любую из нод)» - то есть сеть у него есть, просто у него настройки кластерной сети походу слетели.

no-dashi-v2 ★★
()
Ответ на: комментарий от thesis

Да у него вообще каша. В одной куче блейды, альт, проксмокс, кластер из двух участников и прочие кони. Чел небось не знает что такое «блейд», не говоря уже про остальное.

targitaj ★★★★★
()
Ответ на: комментарий от bigbit

На блейде перестала работать сеть, в т.ч. коммутация между нодами. Ноды не видят друг друга, а без второй ноды запуск сервера невозможен или, я не знаю как это сделать.

ogankvik
() автор топика
Ответ на: комментарий от bigbit

Блейд это. Вот такое у него слабое место, внутренний свитч называется, он не дублирован. Но по хорошему, по правильному, те кто такое эксплуатируют должны это знать и иметь запасной. При наличии резерва весь простой с ремонтом сводится к замене модуля.

Jameson ★★★★★
()
Ответ на: комментарий от ogankvik

Я конкретно за этот блейд не скажу, я его вживую не видел. Похоже что он... Но во первых у тебя должна быть документация, а во вторых у них у всех есть rs232, я так понимаю это аппаратная консоль, судя по маркировке. Так что я бы поподключался и посмотрел изнутри, как оно там и ваще...

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

То есть как это не дублирован? В том же HP c7000 два заменяемых свитча (сетевых или FibreChannel). Каждый блэйд втыкается двумя портами в каждый свитч.

Сломаться может midplane, но это значит, что всему шасси кирдык. Оно ломается очень редко, т.к. на нем нет активных элементов, только распайка.

bigbit ★★★★★
()
Последнее исправление: bigbit (всего исправлений: 1)
Ответ на: комментарий от ogankvik

Раз у тебя 2 модуля, на серверах должно быть по 2 сетевых интерфейса минимум (для полноразмерного блейда - 4), объединенных в бондинг, чтобы авария одного модуля никак не влияла.

Кинь вывод команды «ip a s» - что там вообще с сетевыми интерфейсами, есть ли бондинг?

bigbit ★★★★★
()
Последнее исправление: bigbit (всего исправлений: 2)
Ответ на: комментарий от ogankvik

То, что на фото - это все, что у тебя есть? Других модулей нет?

Тогда у тебя всего один сетевой модуль (тот, который горит оранжевым). А тот, в котором всего один порт RJ-45 - это управляющий модуль всего шасси, на него вообще пофиг.

Раз шасси покупали в такой комплектации (с одним модулем вместо двух), значит, простой для этой системы не критичен. Глупо подпрыгивать из-за того, что железка сломалась.

bigbit ★★★★★
()
Ответ на: комментарий от bigbit

Парни, спасибо вам огромной за помощь и участие! Проблема решена.

Пришел человек, подключился по com`у к управляющему модулю, увидел в консоли его айпи адрес. Мы подключились, ОС сказал что сетевой модуль дохлый. Я добыл несколько USB сетевых карт ( https://i.ibb.co/SrcxQKQ/viber-2023-02-28-20-27-23-743.jpg ), перенастроили бридж и вуаля, кластер заработал, 1С запустилась ;)

ogankvik
() автор топика
Ответ на: комментарий от x22

Или для базы данных и 1С вообще достаточно одного невыключаемого PC у бюстгалтерши тети Клавы. Таки что-то поцказывает, что результат будет примерно такой же.

но у гены не было бы яхты )

kindof
()

А там нет способа временно понизить кворум до одной ноды? И второй сервак отрубить для гарантии чтоб сплит не пошёл.

Ну и кластер из двух нод это не кластер, надёжность ниже чем у одной ноды

upcFrost ★★★★★
()
Последнее исправление: upcFrost (всего исправлений: 1)