LINUX.ORG.RU

NVME, Proxmox IO error

 ,


0

1

Ситема Proxmox (Debian) утсановлена на NVME накопителе. В нем крутятся виртуальные машины с автоматическим бекапом. В один момент бекапы перестали сниматься из-за ошибок чтения на диске.

Mar 08 13:34:24 pve kernel: blk_update_request: critical medium error, dev nvme0n1, sector 490369536 op 0x0:(READ) flags 0x0 phys_seg 3 prio class 2
Mar 08 13:34:28 pve pvedaemon[2703]: ERROR: Backup of VM 100 failed - job failed with err -61 - No data available

пробую прочитать этот сектор через dd

 dd if=/dev/nvme0n1 bs=512 skip=490369535  count=2  | hexdump -C

сектор читается без проблем. Вопрос - можно ли через dd склонировать весь диск на другой такого же размера? Или может утилиты есть какие-то позволяющие привести nvme в чуство пусть и не надолго. Proxmox не дает снять бекап образа виртуальной машины из-за этой ошибки Проблемные сектора скорее всего не содержат важной информации. Проблемный диск системный - можно ли клонировать системный диск из под этой же системы? Ядро по идее крутится то в памяти. Или какой правильный способ клонирования диска?

Ответ на: комментарий от shalom_

Бекапа самой системы нет. Бекап виртуальных машин есть до того, как появились проблемы на nvme, но ценные данные (бд postgresql) есть свежие бекапы. А что может помешать? Ремап секторов битых как происходит? Боюсь что бы при клонировании на новом диске сектора не были помечены как битые - точно не знаю как механизм ремапа в nvme дисках устроен.

pistoletov
() автор топика
Ответ на: комментарий от pistoletov

Боюсь что бы при клонировании на новом диске сектора не были помечены как битые

Не бойся, это внутреняя логика самого контроллера ssd, dd о ней понятия не имеет, какие данные ему отдадут, такие он и запишет

Бекапа самой системы нет.

Плохо. А если оно сдохет сразу и целиком, будешь заново всё настраивать?

shalom_ ★★
()
Последнее исправление: shalom_ (всего исправлений: 1)
Ответ на: комментарий от ValdikSS

точно 512

fdisk -l /dev/nvme0n1
Disk /dev/nvme0n1: 476.94 GiB, 512110190592 bytes, 1000215216 sectors
Disk model: NX-512
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: gpt

pistoletov
() автор топика
Ответ на: комментарий от shalom_

Плохо. А если оно сдохет сразу и целиком, будешь заново всё >настраивать?

да сам proxmox накатить совсем несложно. Ценноcть это VM они и бекапятся. Заметил проблему через несколько дней только. Отсюда не самый свежий образ VM Но довести до актуального тоже несложно. Есть бекапы ответственных данных. Но думаю клон nvme самый наверное быстрый способ если все получится.
Вообще странно что бекап спотыкается на этом секторе а dd читает его без ошибок

pistoletov
() автор топика
Ответ на: комментарий от Dimez

Ты в своём уме дешманский kingspec в продакшн ставить? ну за это и поплатился. Ставил что было тогда под рукой. Но надежные бекапы нивелировали проблему. Да и система невысоконагруженная.

Вот теперь нужен совет. На одном разделе у меня и rootfs и lvm-thin хранилище.

nvme0n1                               259:0    0 476.9G  0 disk
├─nvme0n1p1                           259:1    0  1007K  0 part
├─nvme0n1p2                           259:2    0   512M  0 part  /boot/efi
└─nvme0n1p3                           259:3    0 476.4G  0 part
  ├─pve-swap                          253:0    0     8G  0 lvm   [SWAP]
  ├─pve-root                          253:1    0    96G  0 lvm   /
  ├─pve-data_tmeta                    253:2    0   3.6G  0 lvm
  │ └─pve-data-tpool                  253:4    0 349.3G  0 lvm
  │   └─pve-data                      253:5    0 349.3G  1 lvm
  └─pve-data_tdata                    253:3    0 349.3G  0 lvm
    └─pve-data-tpool                  253:4    0 349.3G  0 lvm
      └─pve-data                      253:5    0 349.3G  1 lvm

хотел бы на новый диск перенести систему. tpool уже не нужно. Как лучше это сделать? перенести нужно boot efi pve-root ну и таблицу разделов конечно.

pistoletov
() автор топика
Ответ на: комментарий от Dimez

Сделай бэкап и pvmove а бекап чего? виртуальные машины у меня уже успешно на новом диске крутятся. Сам prox rootfs через pvemove перенесется? а boot efi создать заново разделы и скопировать ? или через dd как-то нужно? или может все через dd перенести? в количестве секторов до этого раздела

├─pve-data_tmeta                    253:2    0   3.6G  0 lvm

или разделы лежать не последовательно друг за другом на диске?

pistoletov
() автор топика
Ответ на: комментарий от pistoletov

систему то зачем переносить, ее проще переустановить, даже в вики proxmox такой способ восстановления/переезда описан, достаточно конфиги скопировать из /etc/pve

HighwayStar ★★★★★
()
Ответ на: комментарий от HighwayStar

Но у меня еще в проксе стоит NUT довольно геморно его ставить было плюс еще немного софта. Не хотелось бы все заново переставлять Но как крайний вариант можно и переставить

pistoletov
() автор топика
Ответ на: комментарий от sin_a

А как отличить дешманский от нормального?

Например, по TBW.

Я как-то использовал десктопные Crucial BX100 на дедиках (используемый по ряду причин хостер тогда предлагал только их), это было ужасно. Во-первых, они дохли каждые полгода-год по исчерпанию ресурса, во-вторых, начинали адово тормозить при заполнении выше 90% (например, как тебе скорость записи 5MB/s?).

Dimez ★★★★★
()