LINUX.ORG.RU

Это сообщение от ядра, о том, что в указанных подсистемах произошёл сбой. Причина сбоя могла быть как аппаратная, например отвалился один из дисков либо программная, например глюк в ядре.

kostik87 ★★★★★
()

Если в последнее время не обновлялся, то прогони тест на память.

stave ★★★★★
()

Последнее время не обновлялся. memtest, smartctl прогоню завтра, когда буду на месте.

А на данный момент, что удалось вытащить из лога, пока сервер не завис.

Apr 20 03:26:47 v1 kernel: ata3.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
Apr 20 03:26:47 v1 kernel: ata3.00: irq_stat 0x40000008
Apr 20 03:26:47 v1 kernel: ata3.00: failed command: READ FPDMA QUEUED
Apr 20 03:26:47 v1 kernel: ata3.00: cmd 60/20:00:60:87:bf/00:00:e4:00:00/40 tag 0 ncq 16384 in
Apr 20 03:26:47 v1 kernel:         res 41/40:20:68:87:bf/00:00:e4:00:00/00 Emask 0x409 (media error) <F>
Apr 20 03:26:47 v1 kernel: ata3.00: status: { DRDY ERR }
Apr 20 03:26:47 v1 kernel: ata3.00: error: { UNC }
Apr 20 03:26:47 v1 kernel: ata3.00: configured for UDMA/133
Apr 20 03:26:47 v1 kernel: ata3: EH complete

Apr 21 09:58:01 v1 kernel: BIOS-provided physical RAM map:
Apr 21 09:58:01 v1 kernel: BIOS-e820: 0000000000000000 - 000000000009d400 (usable)
Apr 21 09:58:01 v1 kernel: BIOS-e820: 000000000009d400 - 00000000000a0000 (reserved)
Apr 21 09:58:01 v1 kernel: BIOS-e820: 00000000000e0000 - 0000000000100000 (reserved)
Apr 21 09:58:01 v1 kernel: BIOS-e820: 0000000000100000 - 0000000020000000 (usable)

Apr 21 09:58:01 v1 kernel: last_pfn = 0x81fe00 max_arch_pfn = 0x400000000
Apr 21 09:58:01 v1 kernel: MTRR default type: uncachable
Apr 21 09:58:01 v1 kernel: MTRR fixed ranges enabled:
Apr 21 09:58:01 v1 kernel:  00000-9FFFF write-back
Apr 21 09:58:01 v1 kernel:  A0000-BFFFF uncachable
Apr 21 09:58:01 v1 kernel:  C0000-CFFFF write-protect
Apr 21 09:58:01 v1 kernel:  D0000-E7FFF uncachable
Apr 21 09:58:01 v1 kernel:  E8000-FFFFF write-protect
Apr 21 09:58:01 v1 kernel: MTRR variable ranges enabled:
Apr 21 09:58:01 v1 kernel:  0 base 000000000 mask 800000000 write-back
Apr 21 09:58:01 v1 kernel:  1 base 800000000 mask FE0000000 write-back
Apr 21 09:58:01 v1 kernel:  2 base 0E0000000 mask FE0000000 uncachable
Apr 21 09:58:01 v1 kernel:  3 base 0D0000000 mask FF0000000 uncachable
Apr 21 09:58:01 v1 kernel:  4 base 0CF000000 mask FFF000000 uncachable
Apr 21 09:58:01 v1 kernel:  5 base 81FE00000 mask FFFE00000 uncachable

AMVavilov
() автор топика
Ответ на: комментарий от AMVavilov
Apr 20 03:26:47 v1 kernel: ata3.00: exception Emask 0x0 SAct 0x1 SErr 0x0 action 0x0
Apr 20 03:26:47 v1 kernel: ata3.00: irq_stat 0x40000008
Apr 20 03:26:47 v1 kernel: ata3.00: failed command: READ FPDMA QUEUED
Apr 20 03:26:47 v1 kernel: ata3.00: cmd 60/20:00:60:87:bf/00:00:e4:00:00/40 tag 0 ncq 16384 in
Apr 20 03:26:47 v1 kernel:         res 41/40:20:68:87:bf/00:00:e4:00:00/00 Emask 0x409 (media error) <F>
Apr 20 03:26:47 v1 kernel: ata3.00: status: { DRDY ERR }
Apr 20 03:26:47 v1 kernel: ata3.00: error: { UNC }
Apr 20 03:26:47 v1 kernel: ata3.00: configured for UDMA/133
Apr 20 03:26:47 v1 kernel: ata3: EH complete

Диск умирает

menzoberronzan
()

Передёрнул все шлейфы. Сглючивший хард находится в RAID массиве, сейчас восстанавливается. Некоторые ошибки на нём имеются.

Error 66 occurred at disk power-on lifetime: 12008 hours (500 days + 8 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 f8 ac fe 08  Error: UNC at LBA = 0x08feacf8 = 150908152

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 00 80 b0 09 49 00      00:11:34.011  READ FPDMA QUEUED
  60 00 00 80 ac 09 49 00      00:11:34.009  READ FPDMA QUEUED
  60 00 00 80 a8 09 49 00      00:11:34.007  READ FPDMA QUEUED
  60 00 00 80 a4 09 49 00      00:11:34.005  READ FPDMA QUEUED
  60 00 00 80 a0 09 49 00      00:11:34.002  READ FPDMA QUEUED

Всю проверку памяти произвести не успел. Большой объём, долго ждать. Сейчас наблюдаю. Вроде работает.

AMVavilov
() автор топика
Ответ на: комментарий от AMVavilov

Проблему решил лишь полной переустановкой Proxmox.

AMVavilov
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.