LINUX.ORG.RU
ФорумTalks

⚡⚡⚡У процессоров AMD очередные проблемы

 


0

1

Процессоры AMD EPYC Rome зависают через 1044 дня непрерывной работы, и исправлять эту ошибку не будут

AMD обнародовала (PDF) информацию об ошибке, которая возникает у серверных процессоров EPYC 7002 Rome — она приводит к зависанию ядра после 1044 дней непрерывной работы. То есть для корректной работы сервер придётся перезагружать каждые 2,93 года. И исправлять эту ошибку в AMD не собираются.

Проблема связана с тем, что ядру не удаётся выйти из энергосберегающего режима CC6 (Core C6 State), который предусматривает понижение напряжения и снижение частоты при бездействии. AMD уточнила, что срок возникновения сбоя может зависеть от модуляции Spread Spectrum и опорной частоты REFCLK, которая помогает чипу отслеживать время.

Правдоподобную гипотезу о причине возникновения ошибки выдвинул пользователь Reddit acid_migrain. По его версии, ошибка в реальности проявляется не через 1044, а через 1042 дня и 12 часов. Timestamp Counter Scaling работает на частоте 2800 МГц. Путём нехитрых вычислений получается, что 2800 × 106 × 1042,5 приблизительно равно 0x3800000000000000 — здесь «слишком много нулей, чтобы это не было совпадением». У проблемы два простых решения: либо перезагружать сервер через каждые 1044 дня (исходя из информации AMD), либо отключить энергосберегающий режим CC6.

Процессоры серии AMD EPYC Rome вышли в 2018 году, и не исключено, что некоторые их владельцы уже сталкивались с этой проблемой. Производитель добавил, что исправлять ошибку не планирует — возможно, это потребовало бы слишком высоких затрат или она затрагивает не столь большое число клиентов.

Подробности

Правдоподобную гипотезу о причине возникновения ошибки выдвинул пользователь Reddit

И где же гипотеза?..

Sahas ★★★★☆
()

А ты шустрый. Всего два дня прошло.

imul ★★★★★
()

Кажется в intel-вских ssd тоже была timebomb, но там правда обновление прошивки выпустили

cobold ★★★★★
()

исправлять эту ошибку не будут

Очень плохо. Но на интел переходить всё равно не подумаю.

firkax ★★★★★
()

#не_баг_а_фича

Syncro ★★★★★
()

То есть для корректной работы сервер придётся перезагружать каждые 2,93 года.
исправлять эту ошибку не будут

Ибо в AMD знают восточную мудрость: «Через 3 года либо ишак, либо падишах помрёт» :)

quickquest ★★★★★
()

некоторые их владельцы уже сталкивались с этой проблемой

Ждём владельцев со своим uptime?

NyXzOr ★★★
()

Хотел принести, но было лень. Поэтому я использую процессоры Intel и всем клиентам советую.

xwicked ★★☆
()
Ответ на: комментарий от grem

Зависают через 3 года нахождения в режиме энергосбережения?

Вот этого конечно, я из новости не понял. Зачем держать его в режиме энергосбережения, если это сервак?

xwicked ★★☆
()
Ответ на: комментарий от dk__

Я просто констатирую, что новость написана по всем канонам — шокирующий заголовок, три абзаца подряд повторение одного и того же текста, в каждом новом абзаце раскрываются новые детали и вколачиваются предыдущие, предположения анонимного пользователя, и регулярные усилительные конструкции.

Aceler ★★★★★
()
Ответ на: комментарий от Aceler

А. Я настолько привык, что уже на автомате фильтрую читая «новости».

Лучше бы уж их всех выгнали пиццу разводить, а писать чатгп посадили. Он уже лучше пишет.

dk__
()
Ответ на: комментарий от xwicked

Для продакшена они не готовы, ни VirtualBox, ни KVM. В VMWare всё работает и не глючит с полпинка.

как ты был чайником, так ты им и остался

targitaj ★★★★★
()

амд очередной раз пустила жидкого

slyjoeh ★★★
()
Ответ на: комментарий от Vsevolod-linuxoid

Степень нехорошести каждый определяет индивидуально, но заметка призвана задрать значимость до небес.

Aceler ★★★★★
()
Ответ на: комментарий от Aceler

Аппаратный баг, из-за которого процессор зависает при непрерывной работе - это незначительная мелочь? Я бы понял, если бы речь шла о десктопном камне, но это серверный сегмент, лол.

alex1101
()
Ответ на: комментарий от alex1101

Скажем так, этот баг значительно менее значителен, чем, например, знаменитый фейл у интеля с делением. 2+ года аптайма - это ОЧЕНЬ много. Машины хорошо бы ребутать пару раз в год.

targitaj ★★★★★
()
Ответ на: комментарий от alex1101

Ага, на десктопе было бы почти не страшно. Ну очень немногие так гонят аптайм.

Vsevolod-linuxoid ★★★★★
()

За три года ни одного апдейта с перезагрузкой?

Tigger ★★★★★
()
Ответ на: комментарий от Vsevolod-linuxoid

В серверных такого бедлама нет

от чего работают сервера если электричество отключили? топливные электрогенераторы? так они не везде есть, где я работаю точно нет, а сервера есть - которые тухнут каждый раз когда по высокой пропадает.

amd_amd ★★★★★
()

AMD EPYC

Что-то на богатом.

Nervous ★★★★★
()

⚡⚡⚡

Я за бан.

ox55ff ★★★★★
()
Ответ на: комментарий от Vsevolod-linuxoid

ИБП в стойках, потом дизель запускают

ИБП корректно тушат сервера, а пока заведут генератор - вечность пройдет

сменить место работы

шило на мыло или того хуже - пройденый этап, сейчас работаю на двух работах, если только устроиться на третью и там окажется неплохо - с одной из двух других можно будет уволиться, но скрее всего придется работать на трех, с зарплатами в россии все хуже и хуже - раньше мне хватало одной работы, а сейчас двух стало не хватать.

amd_amd ★★★★★
()

Можно подумать амд сможет проработать эти 1044 дня без других отвалов.

chenbr0
()
Ответ на: комментарий от targitaj

как ты был чайником, так ты им и остался

кто из крупняков использует VB, Oacle, Amazon, M$? Где эти продакшн-пользователи VB?

xwicked ★★☆
()

Назвать происходящее «вотчдогом» и перевести из багов в фичи

vaddd ★☆
()
Ответ на: комментарий от no-such-file

не слышал

а чего я слышать должен? сижу на смене - вдруг бах по высокой пропало и все предприятие погрузилось в темноту? какой двойной ввод? какой авр? звонишь в ленэнерго - называешь название организации и фамилию, спрашиваешь что за херня, иногда они уже вкурсах и говорят напряжение будет тогда то, а иногда - приезжают лично, я без них в их тп лезть не имею право - мои только понижающие трансформаторы на территории предприятия, оба ввода включены всегда, трансформаторы нахотятся под напряжением и сфазированы.

amd_amd ★★★★★
()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)