LINUX.ORG.RU
ФорумAdmin

CentOS 7 зависает

 ,


0

1

Установлен сервер 1С на базе CentOS 7, который по непонятным причинам иногда намертво зависает в вечернее время. При этом сетевой интерфейс становится недоступным. Посмотреть экран нет возможности, т.к. сервер стоит у клиента, а я подключаюсь к нему по ssh. Помогите установить причину проблемы и по возможности ее исправить.


Ответ на: комментарий от pinus_nigra

Прошу бухгалтера подержать кнопку включения утром. Пока это было три раза за месяц, но уже стало беспокоить меня.

Max77
() автор топика
Ответ на: комментарий от Max77

crashkernel настрой и научи бухгалтера его крашить, там несложные комбинации на клавиатуре, потом сможешь проанализировать дамп.

Vsevolod-linuxoid ★★★★★
()
Ответ на: комментарий от Vsevolod-linuxoid

Забрал сервер домой на выходные. При запуске 1С сервер отвалился. На экране образовались зеленые квадраты в шахматном порядке и проскакивают желтые полосы.

Max77
() автор топика
Ответ на: комментарий от Max77

На экране образовались зеленые квадраты в шахматном порядке и проскакивают желтые полосы.

Проверь сам монитор, кабель, видеокарту.

Vsevolod-linuxoid ★★★★★
()
Ответ на: комментарий от Vsevolod-linuxoid

В качестве монитора сейчас ТВ. Кабель исправный. В ночь запустил stress-ng –class cpu. Вентилятор CPU на всю катушку, но температура в пределах нормы. Сейчас сервер работает. Запустил stress-ng –class memory

Max77
() автор топика
Ответ на: комментарий от Max77

Стресс памяти закончился. Было несколько сообщений вида

stress-ng: info: [18471] stress-ng-membarrier: this stressor is not implemented on this system: x86_64 Linux 5.3.9-1.el7.elrepo.x86_64

stress-ng: fail: [18504] stress-ng-mergesort: mergesort failed: 22 (Invalid argument)

info: 5 failures reached, aborting stress process

stress-ng: fail: [18504] stress-ng-mergesort: mergesort failed: 22 (Invalid argument)

stress-ng: info: [18525] stress-ng-numa: system has 1 of a maximum 8 memory NUMA nodes

Но тест завершился. Сервер не завис.

Max77
() автор топика
Ответ на: комментарий от Vsevolod-linuxoid

Системный блок Acer. У него свой собственный БП и материнская плата отличается от привычных ATX/ITX

Max77
() автор топика
Ответ на: комментарий от Max77

Кстати насчет БП мысль не лишена смысла. Вы написали что сервер отваливается, не спрашивали у бухгалтера он вырубается или остается включенным но недоступным (какая лампочка горить)?

Совсем глупый вариант, но с учетом что врубает бухгалтер, а у сервака настроено включение после пропадания-появление питания? А то может у вас уведомлений от упса нет, питание грохнулось, упс отработал у вырубился, питание появилось но сервак остается выключенным.

anc ★★★★★
()
Ответ на: комментарий от anc

Совсем глупый вариант

Ну судя по тому, что он у него в руках завис, больше похоже на аппаратную проблему. А проблема может быть в БП. И вообще диагностику надо начинать с питания.

Deleted
()
Ответ на: комментарий от Deleted

Возможно я не так распарсил, подумал что у него видяха/моник по какой-то причине не кажет. А сам сервак работает, поэтому предположил и такой вариант.
ЗЫ Вообще как по мне, то слова «accer» и «сервер» не сопоставимы.

anc ★★★★★
()
Ответ на: комментарий от anc

Сервер не выключается физически. Он подключен к UPS и работает. При мне он несколько раз падал. Пример: Утро 5:00. Запускаю тестирование и исправление 1С с компьютера бухгалтера. ТИИ обрывается в процессе. Комп бухгалтера работает, все оборудование работает. Утром приходит бухгалтер и говорит, что лампочка на сервере горит.

Вчера он дома «упал» просто при запуске 1С Предприятия.

У меня есть совсем шальная мысль, что падает он от сервера 1С или СУБД PostgreSQL.

Сегодня с утра сервер стоит под stress-ng. Package id 0: +77.0°C (high = +82.0°C, crit = +100.0°C)
Core 0: +77.0°C (high = +82.0°C, crit = +100.0°C)
Core 1: +74.0°C (high = +82.0°C, crit = +100.0°C)
Core 2: +77.0°C (high = +82.0°C, crit = +100.0°C)
Core 3: +76.0°C (high = +82.0°C, crit = +100.0°C)
Core 4: +77.0°C (high = +82.0°C, crit = +100.0°C)
Core 5: +73.0°C (high = +82.0°C, crit = +100.0°C)

Max77
() автор топика
Последнее исправление: Max77 (всего исправлений: 1)
Ответ на: комментарий от Deleted

Системный блок на гарантии. Ему меньше 2 месяцев. Проблема в том, что в СЦ я скорее всего не смогу продемонстрировать эту проблему. Да и пошлют они куда подальше. С завода там какой-то юзерский Linux стоял.

Max77
() автор топика
Ответ на: комментарий от Max77

Если у вас тоже падает то как писали выше crashkernel не пробовали?

У меня есть совсем шальная мысль, что падает он от сервера 1С или СУБД PostgreSQL.

Может. Но что такое падает от софта? Нагрузка. А нагрузка она разная бывает. Тестирование только одного компонента не факт что даст туже самую нагрузку как в реалии. У вас же и харды и память и мать... Если не можете выяснить на каком моменте в софт проблеме возникает крэш (лучше выяснить), то отправляете в гарантийку со словами «при большой нагрузке оно дохнет». Это уже их забота будет.

anc ★★★★★
()
Ответ на: комментарий от anc

По моему опыту, ОС может наглухо виснуть даже по такой банальной причине, как забитый доверху swap, жадное до памяти приложение и неуспевший OOM-killer.

Vsevolod-linuxoid ★★★★★
()
Ответ на: комментарий от Vsevolod-linuxoid

Скорее всего так оно и есть. Сейчас уже часов 12 непрерывной загрузки системы. Если бы железо было нестабильно, то наверное уже что-то вылезло

Max77
() автор топика
Ответ на: комментарий от Max77

Ну так ты crashkernel пробовал или как? Что в дампе? Гадать на кофейной гуще можно долго.

Vsevolod-linuxoid ★★★★★
()

Используешь некро дистрибутив в котором еще не закрытые дыры где вендоры шевелят и шатают вой процессор как хотят и удивляться что он зависает от их секретной команды когда он подключен к интернету и не виснет когда не подключен шел 2019

anonymous
()
Ответ на: комментарий от anc

Там после

секретной команды

понятно, что это поток бреда.

Deleted
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.