LINUX.ORG.RU

CPU #10 stuck for 67s!


0

1

Расчётный кластер на GPU.

При запуске расчётных программ на одной из нод кластера выдаётся сообщение:

CPU #10 stuck for 67s! Call Trace: Code: (далее идёт куча шестнадцатеричного кода)

Сообщения такого типа идут с интервалом несколько секунд Машина не реагирует ни на физическую консоль, ни на доступ по сети. В чём может быть дело?


В чём может быть дело?

В говножелезе. Или в отсутствии специалиста по правильной организации охлажения.

anonymous
()

далее идёт куча шестнадцатеричного кода

Там справа от шестнадцатеричного кода имена вызовов не написаны? У меня сегодня жена на десктопе (ядро 3.6.2-4, FC17, AMD x86_64) такой же клин схватила при доступе к диску, в call stack вижу обращения ext4_get_acl. Система тоже перестала реагировать на что-либо, только дампы эти генерировала, при том на одном и том же ядре. Думаю может noapic стоит добавить в параметры ядра, но сперва передёрну все разъёмы - может так пройдёт..

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.