LINUX.ORG.RU

Помогите разобраться с поддержкой ECC

 ,


1

2

Решил собрать домашний сервер отдельной железкой. Так как уже есть две планки DDR4 ECC, то разумно взять под них мать с поддержкой ECC, но тут выяснилось что это не такое уж и частое явление, кроме того есть матери которые поддерживают ECC в non-ECC режиме, да еще и вроде проц должен поддерживать... или не должен?

А на LGA2011, где есть дешевые камни, матери стоятн конских денег, а на AM4 где вроде есть дешевые матери, вообще не понятно поддерживают ли Athlon'ы ECC, а Ryzen, хочет чтобы я к электричеству все это подсоединял.

Вообщем я запутался. Подскажите что нужно выбрать. В приоритете цена и энергопотребление. Производительность вообще не нужна - там будет торентокачалка + DLNA + файловый сервер.

Ответ на: комментарий от anonymous

При том, что мать тоже должна поддерживать ecc. Где что находится не важно, производитель может в том числе нарочно сделать ограничения.

anonymous ()

Только вчера разжился гайдом, как собрать ксеон на 2011 сокете за 20к 😁

https://xeon-e5450.ru/socket-2011-3/aktualnye-sborki-na-2011-3-sokete/

Я так понимаю, китайцы в третью смену отливают ксеоны и материнки под них. Под ecc я так понял работает связка - Xeon E5 1650 v3 + Huananzhi x99-f8, а память уже есть у тебя.

chenbr0 ()
Ответ на: комментарий от chenbr0

Я так понимаю, китайцы в третью смену отливают ксеоны и материнки под них.

o_O как такое могло в голову прийти? Есть рынок БУ уже никому «ненужных» списанных зионов и тонны списанной серверной памяти. И есть китайцы, которые продадут что угодно и кому угодно. Вот они и наладили производство десктоп-материнок под серверные процы и память, превратив утиль в прибыльный товар.

Какая третья смена?

Опять же, китайцы совершенно легально клепают под своими брендами ту же память и видюхи.

vvn_black ★★★★★ ()
Последнее исправление: vvn_black (всего исправлений: 3)

В приоритете цена и энергопотребление. Производительность вообще не нужна - там будет торентокачалка + DLNA + файловый сервер.

У intel ECC поддерживается в i3 процессорах (в i5+ специально убрано по маркетинговым соображениям), но это в теории работает, на уровне обычных мат. плат непонятно.

И главное не перепутать unbuffered ECC-RAM с Registered ECC (RDIMM), первая вроде может работать на обычных платах, вторая нет (только в серверных платах, где обычная память не заработает).

anonymous ()
Ответ на: комментарий от hateWin

Сижу второй день облизываюсь. Причем нашел там 770 до 10к, уже неплохо. Днищесборка за 50к заиграла новыми красками, учитывая какой шлак сейчас продается из нового.

chenbr0 ()
Ответ на: комментарий от anonymous

ЕСС - это +8 линий данных. если на плате эти контакты не подключены к сокету, или если нет кода инициализации контроллера в ЕСС режиме (или код есть но в биосе опция стоит в off и скрыта из настроек) - ЕСС не заработает.

NiTr0 ★★★★★ ()
Ответ на: комментарий от chenbr0

а толку от этих 12 ядер, если производительность каждого сравнима с ядром атома J5005?… ну и процы (и чипсеты) эти - из блейд-серверов, где они жарились при 80-90 градусах, и сколько они проработают еще - неизвестно. бывают и мертвые/глюкавые изначально…

NiTr0 ★★★★★ ()
Последнее исправление: NiTr0 (всего исправлений: 1)
Ответ на: комментарий от chenbr0

Это уже да. Но всё равно парашничество. На алихе на страницах материнок куча приписок про всякие косяки. От серверного железа надёжности ожидаешь, а тут… Но я бы закупился по фану, если бы мне было куда это поставить.

WitcherGeralt ★★ ()
Ответ на: комментарий от WitcherGeralt

процы тоже дохнут от длительного перегрева. что серверные что десктопные. некрозионы с глюкавыми блоками, которые вешаются в определенных сценариях - вполне себе нормальное явление. да и десктопные камни тоже мрут - *лейки например довольно кучно идут (у меня один на руках умер, без перегрева - просто ночью взял и помер; у знакомого есть полудохлик который бутается но винду загрузить не способен, синьку кидает)

NiTr0 ★★★★★ ()
Ответ на: комментарий от NiTr0

а толку от этих 12 ядер

Да, норм:

  • файрфокс собирается за ~25-28 мин, clang - чуть больше 15 мин.
  • запуск какого-нибудь эмуля, виртуалки и т.п. практически никак не сказывается на общей производительности/потреблении электричества

Если интересны цифры по энергопотреблению, системник на E5 2678v3 + 2x16 DDR3 + GT 1030 + 5 винтов:

  • в простое 87-90 Вт
  • обычная нагрузка для десктопа (кодинг, браузинг) - 95-100Вт
  • если ещё видосик 1080p на ютубе - 105 Вт
  • при 100% нагрузке (канпилянии в 25 потоков) не больше 206 Вт, это с залоченным бустом, т.е. на полные герцы работают только два ядра
  • температура, термопара на крышке проца, в простое или средней нагрузке - 40 °C, при длительной (15+ минут) полной нагрузке 200+ Вт разогревается до 70+ °C. Охлаждение - какая-то старая башня Ninja с вентилятором на 700 об/мин. Правда, корпус хороший с 120 вентиляторами.

Интересный момент, на этой башне родной вентилятор сдох, я это заметил только недели через две, когда что-то тяжелое компилял и получил сегфолт, т.е. башня в пассивном режиме справляется с процессором. И пока новый вентилятор ехал доставкой, что нужно собралось без сегфолтов при -j16.

Ватты и температура замеряются залмановской приблудой.

Получается, у меня был апгрейд с i7-2600k на 2678v3 + 1030, чек за электричество точно не вырос, а может даже и уменьшился.

vvn_black ★★★★★ ()
Последнее исправление: vvn_black (всего исправлений: 1)

Команда dmidecode -t 17 | grep -i width показывает ширину слова пересылаемых в/из ОЗУ данных, т.е. для обычной non-ecc памяти — 64 бита (8х8), для ecc — 72 бита (8х9).

Система с памятью, у которой работает аппаратная коррекция ошибок, откликается на эту команду подобным выводом:

Handle 0x0022, DMI type 17, 28 bytes
Memory Device
        Array Handle: 0x0021
        Error Information Handle: Not Provided
        Total Width: 72 bits
        Data Width: 64 bits
        Size: 4096 MB
        Form Factor: DIMM
        Set: None
        Locator: DIMM-1A
        Bank Locator: Not Specified
        Type: <OUT OF SPEC>
        Type Detail: Synchronous
        Speed: 1066 MHz (0.9 ns)
        Manufacturer: Not Specified
        Serial Number: Not Specified
        Asset Tag: Not Specified
        Part Number: Not Specified

https://unix.stackexchange.com/questions/10510/how-to-detect-memory-type-under-linux

iZEN ★★★★★ ()

Нормальная поддержка ECC есть в серверных материнских платах и в материнских платах для рабочих станций.

Всё остальное - на страх и риск. Ищи отзывы владельцев, тестировавших этот режим. Причём просто одной галочки в ОС, что ECC включена, недостаточно. Нужно гнать память до тех пор, пока она не начнёт сбоить и проверять в ОС, что сбои действительно исправляются, счётчики крутятся. Потом гнать ещё выше, пока не начнёт сбоить ECC, чтобы проверить, что ОС отлавливает неисправимую порчу бита и выпадает в правильный паник.

Legioner ★★★★★ ()
Ответ на: комментарий от anonymous

У intel ECC поддерживается в i3 процессорах

Это неправда.

i3 10110U: ECC Memory Supported: No

Celeron G1610T: ECC Memory Supported: Yes

В каждом случае надо проверять по ark. Какой-то закономерности нет.

Legioner ★★★★★ ()
Ответ на: комментарий от NiTr0

Я человек простой, засунул процы по ссылке анона выше:

https://www.cpubenchmark.net/compare/Intel-Xeon-E5-2678-v3-vs-Intel-Pentium-Silver-J5005-vs-Intel-i3-5005U/2584vs3144vs2484

И райзены:

https://www.cpubenchmark.net/compare/Intel-Xeon-E5-2678-v3-vs-AMD-Ryzen-7-1700-vs-AMD-Ryzen-7-1800X-vs-AMD-Ryzen-7-2700/2584vs2970vs2966vs3240

Для меня это интересная альтернатива о которой не знал. То есть в бюджет двух малинок можно купить нормальную основу для подкроватного сервера и играть в 10 виртуалок.

chenbr0 ()

На asus tuf b450-gaming pro не регистровая память с ECC работает, только чтобы собственно ECC заработал нужно в глубине настроек контроллера памяти в uefi включить поддержку. Без этого система запускается и нормально работает, но и оффтопик и онтопик говорят что коррекции ошибок нет

cobold ★★★ ()
Ответ на: комментарий от Legioner

В каждом случае надо проверять по ark. Какой-то закономерности нет.

Ну у intel давно нет закономерностей, я помню как во времена Core 2 Duo VT-x расширение для виртуалак небыло в T7200, было в T7400, а на против T7300 стояла звездочка что уточняйте при покупке, и на работе часть офисных компов могла гонять виартуалку с x64 соляркой на 32-х битном хосте, а другая часть не могла.

Aber ★★★★ ()
Ответ на: комментарий от iZEN
alex@alex-desktop:~$ sudo dmidecode -t 17 | grep -i width 
[sudo] пароль для alex: 
	Total Width: Unknown
	Data Width: Unknown
	Total Width: 72 bits
	Data Width: 64 bits
	Total Width: Unknown
	Data Width: Unknown
	Total Width: 72 bits
	Data Width: 64 bits

Это на матери MSI B450 Gaming Plus (память пока в ней живет) у которой по документам только в non-ECC режиме поддержка: https://ru.msi.com/Motherboard/B450-GAMING-PLUS/Specification

Это нормально?

Suntechnic ★★★★★ ()
Ответ на: комментарий от Suntechnic

Это нормально - на материнке есть дополнительные линии для памяти с коррекцией ошибок. Осталось включить эту функцию и наблюдать лог коррекции.

iZEN ★★★★★ ()

вообще не понятно поддерживают ли Athlon'ы ECC

С амуде ситуация такая: если у процессора есть встроенное видео, но при этом нет приписки «pro» в названии, то ECC работать не будет. А еще такие процессоры oem-only, потому найти их довольно трудно. Материнская плата любая с заявленной поддержкой athlon pro/ryzen pro. Память только udimm.

Khnazile ★★★★★ ()
Ответ на: комментарий от Suntechnic

когда включено, то это отражается в dmesg:

$ dmesg|grep EDAC
[    0.173632] EDAC MC: Ver: 3.0.0
[    4.740761] EDAC amd64: F19h_M20h detected (node 0).
[    4.740806] EDAC amd64: Node 0: DRAM ECC enabled.
[    4.740808] EDAC amd64: MCT channel count: 2
[    4.740832] EDAC MC0: Giving out device to module amd64_edac controller F19h_M20h: DEV 0000:00:18.3 (INTERRUPT)
[    4.740836] EDAC MC: UMC0 chip selects:
[    4.740836] EDAC amd64: MC: 0:     0MB 1:     0MB
[    4.740837] EDAC amd64: MC: 2: 16384MB 3:     0MB
[    4.740840] EDAC MC: UMC1 chip selects:
[    4.740841] EDAC amd64: MC: 0:     0MB 1:     0MB
[    4.740841] EDAC amd64: MC: 2: 16384MB 3:     0MB
[    4.740842] EDAC amd64: using x16 syndromes.
[    4.740848] EDAC PCI0: Giving out device to module amd64_edac controller EDAC PCI controller: DEV 0000:00:18.0 (POLLED)
[    4.740850] AMD64 EDAC driver v3.5.0

и должен быть каталог /sys/bus/edac/devices/mc/mc0, в котором перечислены все установленные модули памяти

когда выключено, то в dmesg другие сообщения

[    0.800281] EDAC MC: Ver: 3.0.0
[    5.918530] EDAC amd64: F19h_M20h detected (node 0).
[    5.918575] EDAC amd64: Node 0: DRAM ECC disabled.
cobold ★★★ ()
Ответ на: комментарий от Suntechnic

Да, на процессорах без видео работает, и мне не удалось найти инфу о случаях, чтобы не работало. Но официально поддержка ecc есть только у pro-моделей, что с с видео, что без.

Khnazile ★★★★★ ()