LINUX.ORG.RU

Помогите разобраться с поддержкой ECC

 ,


3

3

Решил собрать домашний сервер отдельной железкой. Так как уже есть две планки DDR4 ECC, то разумно взять под них мать с поддержкой ECC, но тут выяснилось что это не такое уж и частое явление, кроме того есть матери которые поддерживают ECC в non-ECC режиме, да еще и вроде проц должен поддерживать... или не должен?

А на LGA2011, где есть дешевые камни, матери стоятн конских денег, а на AM4 где вроде есть дешевые матери, вообще не понятно поддерживают ли Athlon'ы ECC, а Ryzen, хочет чтобы я к электричеству все это подсоединял.

Вообщем я запутался. Подскажите что нужно выбрать. В приоритете цена и энергопотребление. Производительность вообще не нужна - там будет торентокачалка + DLNA + файловый сервер.

При чём тут мать? ЕСС должен поддерживать процессор, т.к. контроллер памяти давно в нём.

anonymous
()
Ответ на: комментарий от anonymous

При том, что мать тоже должна поддерживать ecc. Где что находится не важно, производитель может в том числе нарочно сделать ограничения.

anonymous
()
Ответ на: комментарий от anonymous

Очень даже причем. Производители материнок специально указывают в спецификациях, поддерживает ли мать ECC или нет.

hateWin 🤡🤡🤡🤡🤡
()

Только вчера разжился гайдом, как собрать ксеон на 2011 сокете за 20к 😁

https://xeon-e5450.ru/socket-2011-3/aktualnye-sborki-na-2011-3-sokete/

Я так понимаю, китайцы в третью смену отливают ксеоны и материнки под них. Под ecc я так понял работает связка - Xeon E5 1650 v3 + Huananzhi x99-f8, а память уже есть у тебя.

chenbr0 🔥🔥
()
Ответ на: комментарий от chenbr0

Я так понимаю, китайцы в третью смену отливают ксеоны и материнки под них.

o_O как такое могло в голову прийти? Есть рынок БУ уже никому «ненужных» списанных зионов и тонны списанной серверной памяти. И есть китайцы, которые продадут что угодно и кому угодно. Вот они и наладили производство десктоп-материнок под серверные процы и память, превратив утиль в прибыльный товар.

Какая третья смена?

Опять же, китайцы совершенно легально клепают под своими брендами ту же память и видюхи.

vvn_black 👍👍👍👍
()
Последнее исправление: vvn_black (всего исправлений: 3)
Ответ на: комментарий от futurama

картина маслом, лоровская лалка спрашивает, «а где тут у вас сделать зерокопию?», окружающие смотрят на неё как на лалку и переспрашивают, «ксерокопию, вы хотели сказать?»

anonymous
()
Ответ на: комментарий от chenbr0

1650 v3

эта кукруза - половинка от шестиядерного же 5600X. нах оно такое нужно, даже за пол цены же?

anonymous
()

В приоритете цена и энергопотребление. Производительность вообще не нужна - там будет торентокачалка + DLNA + файловый сервер.

У intel ECC поддерживается в i3 процессорах (в i5+ специально убрано по маркетинговым соображениям), но это в теории работает, на уровне обычных мат. плат непонятно.

И главное не перепутать unbuffered ECC-RAM с Registered ECC (RDIMM), первая вроде может работать на обычных платах, вторая нет (только в серверных платах, где обычная память не заработает).

anonymous
()
Ответ на: комментарий от anonymous

Не знаю, но я возбудился.

Материнская плата HUANANZHI X99, atx + процессор Intel XEON E5 2678 V3 + Оперативная память 4*8 ГБ DDR3 3,0 МГц

12 ядер + 32 рамы за 22к - это очень интересно.

chenbr0 🔥🔥
()
Ответ на: комментарий от hateWin

Сижу второй день облизываюсь. Причем нашел там 770 до 10к, уже неплохо. Днищесборка за 50к заиграла новыми красками, учитывая какой шлак сейчас продается из нового.

chenbr0 🔥🔥
()
Ответ на: комментарий от chenbr0

12 ядер

а numa это такое днище, что два процессора быает оказываются медленнее одного такого же

anonymous
()
Ответ на: комментарий от futurama

что забавного в обычном произношении?

anonymous
()
Ответ на: комментарий от anonymous

ЕСС - это +8 линий данных. если на плате эти контакты не подключены к сокету, или если нет кода инициализации контроллера в ЕСС режиме (или код есть но в биосе опция стоит в off и скрыта из настроек) - ЕСС не заработает.

NiTr0
()
Ответ на: комментарий от anonymous

у интела ЕСС есть только на серверных платах (Сххх чипсеты).

регистровая память вроде на Е3 зионах тоже не поддерживается в принципе, только Е5/Е7.

NiTr0
()
Ответ на: комментарий от chenbr0

а толку от этих 12 ядер, если производительность каждого сравнима с ядром атома J5005?… ну и процы (и чипсеты) эти - из блейд-серверов, где они жарились при 80-90 градусах, и сколько они проработают еще - неизвестно. бывают и мертвые/глюкавые изначально…

NiTr0
()
Последнее исправление: NiTr0 (всего исправлений: 1)
Ответ на: комментарий от chenbr0

Это уже да. Но всё равно парашничество. На алихе на страницах материнок куча приписок про всякие косяки. От серверного железа надёжности ожидаешь, а тут… Но я бы закупился по фану, если бы мне было куда это поставить.

WitcherGeralt
()
Ответ на: комментарий от chenbr0

китайцы в третью смену отливают ксеоны

Не отливают. Списанные.

Huananzhi x99-f8

А это отливают. Жуткое дешевое говно.

zemidius
()
Ответ на: комментарий от chenbr0

ryzen 1700-1800-2700 например будут быстрее и холоднее. с ЕСС и прочими плюшками типа 3-летней гарантии (гарантия на товары с али в принципе можно сказать отсутствует).

NiTr0
()
Ответ на: комментарий от WitcherGeralt

процы тоже дохнут от длительного перегрева. что серверные что десктопные. некрозионы с глюкавыми блоками, которые вешаются в определенных сценариях - вполне себе нормальное явление. да и десктопные камни тоже мрут - *лейки например довольно кучно идут (у меня один на руках умер, без перегрева - просто ночью взял и помер; у знакомого есть полудохлик который бутается но винду загрузить не способен, синьку кидает)

NiTr0
()
Ответ на: комментарий от chenbr0

А какой у них ресурс?

  • кто ж знает
  • а какая разница
vvn_black 👍👍👍👍
()
Ответ на: комментарий от NiTr0

а толку от этих 12 ядер

Да, норм:

  • файрфокс собирается за ~25-28 мин, clang - чуть больше 15 мин.
  • запуск какого-нибудь эмуля, виртуалки и т.п. практически никак не сказывается на общей производительности/потреблении электричества

Если интересны цифры по энергопотреблению, системник на E5 2678v3 + 2x16 DDR3 + GT 1030 + 5 винтов:

  • в простое 87-90 Вт
  • обычная нагрузка для десктопа (кодинг, браузинг) - 95-100Вт
  • если ещё видосик 1080p на ютубе - 105 Вт
  • при 100% нагрузке (канпилянии в 25 потоков) не больше 206 Вт, это с залоченным бустом, т.е. на полные герцы работают только два ядра
  • температура, термопара на крышке проца, в простое или средней нагрузке - 40 °C, при длительной (15+ минут) полной нагрузке 200+ Вт разогревается до 70+ °C. Охлаждение - какая-то старая башня Ninja с вентилятором на 700 об/мин. Правда, корпус хороший с 120 вентиляторами.

Интересный момент, на этой башне родной вентилятор сдох, я это заметил только недели через две, когда что-то тяжелое компилял и получил сегфолт, т.е. башня в пассивном режиме справляется с процессором. И пока новый вентилятор ехал доставкой, что нужно собралось без сегфолтов при -j16.

Ватты и температура замеряются залмановской приблудой.

Получается, у меня был апгрейд с i7-2600k на 2678v3 + 1030, чек за электричество точно не вырос, а может даже и уменьшился.

vvn_black 👍👍👍👍
()
Последнее исправление: vvn_black (всего исправлений: 1)

Команда dmidecode -t 17 | grep -i width показывает ширину слова пересылаемых в/из ОЗУ данных, т.е. для обычной non-ecc памяти — 64 бита (8х8), для ecc — 72 бита (8х9).

Система с памятью, у которой работает аппаратная коррекция ошибок, откликается на эту команду подобным выводом:

Handle 0x0022, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x0021
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: 4096 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM-1A
        Bank Locator: Not Specified
        Type: <OUT OF SPEC>
        Type Detail: Synchronous
        Speed: 1066 MHz (0.9 ns)
        Manufacturer: Not Specified
        Serial Number: Not Specified
        Asset Tag: Not Specified
        Part Number: Not Specified

https://unix.stackexchange.com/questions/10510/how-to-detect-memory-type-under-linux

iZEN
()

Нормальная поддержка ECC есть в серверных материнских платах и в материнских платах для рабочих станций.

Всё остальное - на страх и риск. Ищи отзывы владельцев, тестировавших этот режим. Причём просто одной галочки в ОС, что ECC включена, недостаточно. Нужно гнать память до тех пор, пока она не начнёт сбоить и проверять в ОС, что сбои действительно исправляются, счётчики крутятся. Потом гнать ещё выше, пока не начнёт сбоить ECC, чтобы проверить, что ОС отлавливает неисправимую порчу бита и выпадает в правильный паник.

Legioner
()
Ответ на: комментарий от NiTr0

Я человек простой, засунул процы по ссылке анона выше:

https://www.cpubenchmark.net/compare/Intel-Xeon-E5-2678-v3-vs-Intel-Pentium-Silver-J5005-vs-Intel-i3-5005U/2584vs3144vs2484

И райзены:

https://www.cpubenchmark.net/compare/Intel-Xeon-E5-2678-v3-vs-AMD-Ryzen-7-1700-vs-AMD-Ryzen-7-1800X-vs-AMD-Ryzen-7-2700/2584vs2970vs2966vs3240

Для меня это интересная альтернатива о которой не знал. То есть в бюджет двух малинок можно купить нормальную основу для подкроватного сервера и играть в 10 виртуалок.

chenbr0 🔥🔥
()

На asus tuf b450-gaming pro не регистровая память с ECC работает, только чтобы собственно ECC заработал нужно в глубине настроек контроллера памяти в uefi включить поддержку. Без этого система запускается и нормально работает, но и оффтопик и онтопик говорят что коррекции ошибок нет

cobold ☕☕☕☕☕
()
Ответ на: комментарий от chenbr0

у китайских плат бывают нюансы. вида отваливающейся сети/звука/етц но не поголовно, как повезет

anonymous
()
Ответ на: комментарий от anonymous

у китайских плат бывают нюансы

У меня на x99-tf всего два:

  • из S3 просыпается только по кнопке Power, на USB-девайсы не реагирует
  • не работает WoL
vvn_black 👍👍👍👍
()
Ответ на: комментарий от Legioner

В каждом случае надо проверять по ark. Какой-то закономерности нет.

Ну у intel давно нет закономерностей, я помню как во времена Core 2 Duo VT-x расширение для виртуалак небыло в T7200, было в T7400, а на против T7300 стояла звездочка что уточняйте при покупке, и на работе часть офисных компов могла гонять виартуалку с x64 соляркой на 32-х битном хосте, а другая часть не могла.

Aber 👍👍
()
Ответ на: комментарий от iZEN
alex@alex-desktop:~$ sudo dmidecode -t 17 | grep -i width 
[sudo] пароль для alex: 
	Total Width: Unknown
	Data Width: Unknown
	Total Width: 72 bits
	Data Width: 64 bits
	Total Width: Unknown
	Data Width: Unknown
	Total Width: 72 bits
	Data Width: 64 bits

Это на матери MSI B450 Gaming Plus (память пока в ней живет) у которой по документам только в non-ECC режиме поддержка: https://ru.msi.com/Motherboard/B450-GAMING-PLUS/Specification

Это нормально?

Suntechnic
() автор топика
Ответ на: комментарий от Suntechnic

dmidecode показывает чушь и смотреть его бесполезно, впрочем, как и воспринимать изю всерьёз

anonymous
()
Ответ на: комментарий от Suntechnic

Это нормально - на материнке есть дополнительные линии для памяти с коррекцией ошибок. Осталось включить эту функцию и наблюдать лог коррекции.

iZEN
()

вообще не понятно поддерживают ли Athlon'ы ECC

С амуде ситуация такая: если у процессора есть встроенное видео, но при этом нет приписки «pro» в названии, то ECC работать не будет. А еще такие процессоры oem-only, потому найти их довольно трудно. Материнская плата любая с заявленной поддержкой athlon pro/ryzen pro. Память только udimm.

Khnazile ☕☕
()
Ответ на: комментарий от Suntechnic

когда включено, то это отражается в dmesg:

$ dmesg|grep EDAC
[    0.173632] EDAC MC: Ver: 3.0.0
[    4.740761] EDAC amd64: F19h_M20h detected (node 0).
[    4.740806] EDAC amd64: Node 0: DRAM ECC enabled.
[    4.740808] EDAC amd64: MCT channel count: 2
[    4.740832] EDAC MC0: Giving out device to module amd64_edac controller F19h_M20h: DEV 0000:00:18.3 (INTERRUPT)
[    4.740836] EDAC MC: UMC0 chip selects:
[    4.740836] EDAC amd64: MC: 0:     0MB 1:     0MB
[    4.740837] EDAC amd64: MC: 2: 16384MB 3:     0MB
[    4.740840] EDAC MC: UMC1 chip selects:
[    4.740841] EDAC amd64: MC: 0:     0MB 1:     0MB
[    4.740841] EDAC amd64: MC: 2: 16384MB 3:     0MB
[    4.740842] EDAC amd64: using x16 syndromes.
[    4.740848] EDAC PCI0: Giving out device to module amd64_edac controller EDAC PCI controller: DEV 0000:00:18.0 (POLLED)
[    4.740850] AMD64 EDAC driver v3.5.0

и должен быть каталог /sys/bus/edac/devices/mc/mc0, в котором перечислены все установленные модули памяти

когда выключено, то в dmesg другие сообщения

[    0.800281] EDAC MC: Ver: 3.0.0
[    5.918530] EDAC amd64: F19h_M20h detected (node 0).
[    5.918575] EDAC amd64: Node 0: DRAM ECC disabled.
cobold ☕☕☕☕☕
()
Ответ на: комментарий от cobold

когда включено, то это отражается в dmesg

Главное не забывать, что это не означает, что оно работает.

anonymous
()
Ответ на: комментарий от Suntechnic

Да, на процессорах без видео работает, и мне не удалось найти инфу о случаях, чтобы не работало. Но официально поддержка ecc есть только у pro-моделей, что с с видео, что без.

Khnazile ☕☕
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.