LINUX.ORG.RU
ФорумTalks

Нужна ли ECC-память на десктопе?

 ,


0

2

Я вот смотрю планки и, например, выше 2400 MHz не нахожу памяти с ECC, а без ECC есть и 3000. Параметр CL у ECC-памяти тоже довольно высокий, та же 2400 только с CL 17, в то время как у памяти без ECC всё лучше. Про цену молчу, надёжность бесценна, а вот насколько эти сниженные тайминги повлияют на производительность? Процессор предположим более-менее нормальный, тот же ThreadRipper 16-ядерный.

★★★★★

Не нужна. То, на что может повлиять ECC\неECC уже давно реализовано софтовым уровнем.

Очень небольшая вероятность того, что ОЗУ сбойнет, и еще меньшая вероятность того, что этот сбой произойдет именно в той области, которая будет сбрасываться на диск, и достаточно малая вероятность того что твоя ФС пропустит такой фокус.

Для тебя в твоем ютубчике это будет выглядеть скорее всего как квадратик подозрительного цвета на протяжении одной-двух секунд. Если не повезет - ОСь просто повиснет. Но чаще всего просто софтина отвалится в segfault. У меня на десктопе стоит 16 Гб DDR4 неECC. Компьютер почти не выключается вот уже полтора года. Пока сбоев не было.

vblats
()
Ответ на: комментарий от vblats

Очень небольшая вероятность того, что ОЗУ сбойнет

распространненый миф. я пока админил насмотрелся на память, которая как бы работает, но из-за нее все постоянно крешится. была и такая, которая сначала проходила все тесты, а потом начинала сбоить.

Компьютер почти не выключается вот уже полтора года. Пока сбоев не было.

никто не знает, что будет через 5 лет.

crypt ★★★★★
()
Последнее исправление: crypt (всего исправлений: 2)
Ответ на: комментарий от crypt

я пока админил насмотрелся на память, которая как бы работает, но из-за нее все постоянно крешится.

Может, просто не надо покупать говножелезо?

Deleted
()
Ответ на: комментарий от DawnCaster

Это теоретическое балабольство, а я видел ZFS с повреждённой памятью на практике. К счастью, scrub я не делал, но с машиной работал в обычном режиме, соответственно что-то записывалось. Система хоть и вела себя странно (периодически что-то падало, и даже не очень часто), но была относительно юзабельной, так что scrub бы запустить мне запросто позволила. Кончилось тем что я догадался потестить память и заменил её. После этого scrub нашёл невосстановимые файлы с битыми суммами. К счастью, не много, и даже показал какие именно. Увы, не помню были ли там файлы в которые я не писал. Так что уж не знаю что там с ними на деле произошло, но эта чушь про то что чтобы повредить данные нужна хэш коллизия проверку практикой не выдерживает.

На самом деле может даже scrub и не так страшен как обычное копирование, поскольку если бит флипнется в буфере перед записью на диск, ZFS посчитает по этому контрольную сумму, запишет на оба диска и ошибок никаких пе покажет ни при записи ни потом при чтении. А данные будут битые.

slovazap ★★★★★
()
Ответ на: комментарий от crypt

распространненый миф. я пока админил насмотрелся на память, которая как бы работает

Ну и как в этой как бы работающей памяти, тебя спасло как бы работающее ECC ?))

vblats
()
Ответ на: комментарий от slovazap

А тут по форуму бегает парочка zfs-фанбоев, которая советует пихать эту самую zfs повсюду, невзирая на наличие ЕСС. Я всегда знал, что они мудаки, но теперь это просто железобетонная уверенность, спасибо))

Deleted
()
Ответ на: комментарий от DawnCaster

Я думаю, не стоит смешивать потяния: когда память здорова, но иногда в ней возникают скрытые ошибки из-за отсутствия ECC, и когда в памяти начали возникать ошибки из-за старости.

Почему не надо. ECC помогает в обоих случаях и оба случая реально встретить на практике.

Опять-же для обычного десктопного пользователя - это будет совершенно не критично, и он 12,% за ECC память и ещё 100% за серверную материнку и процессор переплачивать не будет.

100% за материнку и процессор переплачивать жалко, тут согласен полностью. Поэтому и нет её нигде. Но AMD предположительно это меняют, тут ничего переплачивать не надо. А 12% за память это не те деньги, которые стоит экономить жертвуя надёжностью. Ну это моё мнение, хорошо же иметь выбор, чем не иметь.

Legioner ★★★★★
() автор топика
Ответ на: комментарий от Deleted

Может, просто не надо покупать говножелезо

Совет из серии «не надо покупать всякую ерунду» от блондинки. Вы как только начнете рассказывать, что есть говножелезо, а что не есть, так на два умника три мнения.

lenin386 ★★★★
()

Если можешь себе это позволить, то желательна. Ты же не хочешь, чтобы случайная космическая частица испоганила фото твоего любимого котика?

А если у тебя что-то серьезней котиков, то ЕЦЦ крайне желательно.

Deleted
()
Ответ на: комментарий от lenin386

Ну покупайте говножелезо дальше и страдайте, мне-то что))

Deleted
()
Ответ на: комментарий от Legioner

Должно выключаться. Контролер репортует про неисправимую ошибку и кто-то переводит процессор в состояние HLT. Вроде так

Ничего он не рапортует. Ты регистровую память с обычной есс попутал.

lenin386 ★★★★
()
Ответ на: комментарий от crypt

И ты попутал регистровую память с обычной есс.

lenin386 ★★★★
()
Ответ на: комментарий от Deleted

А я продолжаю считать что её надо использовать везде и замены ей нет, несмотря на это. Битая память убивает любую систему (скажем, ext4 у меня в похожей ситуации вообще перестала монтироваться), может больше повезти, может меньше. А как ФС ZFS аналогов нет и не предвидится.

slovazap ★★★★★
()
Ответ на: комментарий от slovazap

О, значит, в списке фанбоев уже трое))

Deleted
()
Ответ на: комментарий от crypt

а когда его игра будет вылетать постоянно, ему это будет критично.

Если память не испорченная от старости, то постоянно вылетать не будет, пользователь просто перезапустит игру и продолжит раковать в свои мобы дальше. Да и игры сейчас так делают, что существует 100500 различных причин для вылета и кроме плохой памяти.

обратиться к спецу, тут будет memtest гонять.

И что он выяснит ? Если память не проходит Memtest - то она не пригодна для использования, и точка. Тоже самое актуально и для ECC памяти.

DawnCaster ★★
()
Ответ на: комментарий от Legioner

Почему не надо. ECC помогает в обоих случаях и оба случая реально встретить на практике.

Я может не совсем понятно обяснил. Ситуация когда память сыпется от старости\перегрева\брака - это неисправность, она диагностируется и без ECC - просто гоняйте memtest раз в месяц\два\три\полгода на ночь и будет вам счастье.

Разумеется, с ECC - неисправность, повторяю, НЕИСПРАВНОСТЬ делающая память непригодной для использования диагностируется быстрее.

Редкие ошибки памяти в процессе обычной работы не являются неисправностью, хоть и является ошибкой способной повредить данные. Всё дело в вероятностях. ECC всего-лишь защищает от таких ошибок и снижает вероятность повреждения данных, если вдруг не возникнет двойной ошибки, например.

В обычном десктопном железе есть куча других точек отказа, которые могут вызвать повреждение данных с куда большей вероятностью: отказы питания, перегрев, выход из строя HDD, пиво на клавиатуру и кошачья\собачья ссанина.

Вероятности ошибок от надежности памяти тут ни на что не влияют. Если у вас только не 128 гигов ОЗУ, скажем. И ИБП хороший. И вы гонаяете расчёты, которые должны непрерывно отработать много дней подряд без ошибки. Но это уже не типичное десктопное применение ниразу. Тут можно и с ECC память взять и остальное железо. Тем более что вы уже потратились на 128 гигов озу и хороший ИБП.

Но AMD предположительно это меняют, тут ничего переплачивать не надо.

А это просто замечательно. Может следующий комп от них как раз и буду собирать.

DawnCaster ★★
()
Ответ на: комментарий от Legioner

При двойных ошибках по умолчанию выключается компьютер

С какой стати? Обычное MCE, которое как обработаешь, так и будет.

aidaho ★★★★★
()

До недавнего (2-3 мес назад) времени прям мечтал о ECC, думая, что современная с более тонким техпроцессом работает именно так. Началось с покупки второй плашки (в начале года). Уже день на третий у винды была синька, которая говорила что-то про memory managment. После 10-15 синьки психанул и накатил Debian, где проблема сначала не показывала себя, но это было недолго. Со временем глюки учащались. Периодически сидел то на одной плашке, то на другой. memtest прогонял часами. Напряжение задирал, частоту скидывал, тайминги увеличивал, boost у проца отрезал. Ничего не помогало. Начал уже на контроллер памяти грешить, пока не додумался попробовать сменить материнку. Ни одного глюка с тех пор я не видел (не считая падающих иксов, но это уже другая история). Вообще, с той мамкой глюки были и раньше, но показывали себя крайне редко, где-то раз в полгода.

Slavik763
()
Ответ на: комментарий от Legioner

Любой диск имеет встроенный ECC и не отдаст кривые данные.

Они ещё при передаче могут побиться. На этом собственно и построено объяснение смерти RAID5. При текущих объёмах вероятность сбоя при восстановлении минимального массива становится слишком большой.

atrus ★★★★★
()

Почти. Где-то читал статью с расчётами, где вычислялось начиная с какого объёма без ECC уже никуда. Ссылку не помню. Пока ещё вроде можно, но скоро уже никак.

atrus ★★★★★
()

Как-то повстречался с багом памяти или материнки на одной из файлопомоек-«серверов». Бились архивы при копировании и создании, где-то 1..2 бита на пару гигабайт. Memtest упорно молчал после многочасовых прогонов.
Переплатил бы за ECC? Безусловно. Битые архивы записывались поверх исправных на RAID, это было очень весело. Да, разгон и сниженные тайминги не нужны.

Suigintou ★★★★★
()
Последнее исправление: Suigintou (всего исправлений: 1)
Ответ на: комментарий от DawnCaster

это неисправность, она диагностируется и без ECC - просто гоняйте memtest раз в месяц\два\три\полгода на ночь и будет вам счастье.

да никто этого не будет делать.

crypt ★★★★★
()

При работе с данными, требующими «сквозной» надёжности передачи и хранения (например, с научными расчётами, обработка «больших данных», хранение на ZFS), где небольшое искажение может привести к большим проблемам в выводах и обоснованиях (доказательная база), ECC- память жизненно необходима. Десктопные компьютеры - не исключение. На них производится интерактивный ввод и анализ данных, это - потенциальная точка искажений вводимых данных.

iZEN ★★★★★
()
14 декабря 2017 г.
Ответ на: комментарий от Legioner

Диск тоже может не отдать испорченные данные, а писать I/O Error. Это не страшно. Страшно, когда ты даже не знаешь, что там ошибка. Вот этого происходить не должно.

Но происходит: ключевые слова silent data curruption и bit rot.

gag ★★★★★
()
Ответ на: комментарий от gag

Это миф. Вероятность этого (баг в драйвере или прошивке) настолько мала, что не заслуживает внимания.

Legioner ★★★★★
() автор топика
Ответ на: комментарий от gag

Ну объясни подробно откуда может быть bit rot в современном диске. Например на SSD данные часто вообще шифруются, насколько я знаю, чтобы в ячейках были записаны равномерно нули и единицы (ну и чтобы можно было моментально «очистить» весь диск, стерев ключ). Если там протухнет бит, то расшифровать вообще ничего не выйдет. Чексуммы там же хранятся и проверяются при любом взаимодействии. Т.е. бит может сгнить, я не спорю, но при этом как минимум блок не прочитается совсем, а не отдаст мусор.

В любом случае есть ФС с проверкой контрольных сумм, я хоть и считаю это ненужным, но при желании оно доступно и накладные расходы там вряд ли будут заметны даже на очень быстрых дисках.

Естественно это всё при наличии ECC-памяти. Без неё чудеса могут происходить совершенно незаметно до поры до времени.

Legioner ★★★★★
() автор топика

Я уже пожалел что личные данные держал не в RAID1, восстановление данных с умершего диска обошлось ~150$(без стоимости нового диска).
Так что теперь коплю деньги на RAID1, ZFS что-то не нравится, думаю Brtfs использовать(так как в ext4 нет контроля целостности блоков данных). Плюс еще отдельный диск на Ext4 куда периодически с RAID1 будет синхронизировать данные. Ибо что-то много упоминаний проблем с Brtfs видел.
Так-же пожалел что в свое время не собрал комп с ECC. В одно время у меня через 5-30 минут крашились программы, в итоге выяснил что проблема с памятью и снизил частоту. Затем через время повторилось, еще раз пришлось снизить частоту. Теперь когда что-то падает в голову лезет а не память ли это и хрен без ECC это не узнать.
Так что следующий комп наверно будет на Ryzen Threadripper. 1900X на 8 ядер/16 потоков с базовой частотой 3.8GHz стоит всего 550$ и поддерживает ECC, а у Intel ECC поддерживают только Xeon и аналогичный Xeon Gold 6144 на 8 ядер/16 потоков с базовой частотой 3.5GHz стоит ~3000$. Старые Xeon которые по дешевки можно купить хоть и имеют много ядер но их частота печалит, для меня лучше меньше ядер но больше частота. AVX2 и AVX512 меня вообще не волнуют. Даже Intel Core i9 за 2000$ не поддерживает ECC, с такой политикой от Intel нечего ждать чего-то нормального.
Еще печалит то что стоимость ОЗУ сильно выросла, в свое время купил 32GB DDR3 и не могу нарадоваться.

V1KT0P ★★
()

Если так уж всё критично, цена всё равно и скорость тоже (как говорили выше).

Бери серверную мамку. В современных и не очень мамках часто есть такое понятие как зеркалирование памяти (так сказать RAID1 в RAM), будет памяти в 2 раза меньше, зато работа в более раз надёжнее.

Serg_HIS
()
Ответ на: комментарий от V1KT0P

8 ядер/16

Но зойчем, если 1700 за $329 тоже поддерживает есс?

снизил частоту

Небось феном, который по сути больше 1600 не тянет или в доску разогнаный фуфыкс?

qula
()
Ответ на: комментарий от qula

Но зойчем, если 1700 за $329 тоже поддерживает есс?

Если внимательно разобраться, то окажется что там не все так хорошо. Да ошибки возможно детектить(если подобрать определенную модель материнки), но никто не гарантирует этого. Гарантия только что можно вставить плашку памяти ECC и она будет работать как обычная. Ни о каком восстановлении единичных ошибок и речи не идет.

Небось феном, который по сути больше 1600 не тянет или в доску разогнаный фуфыкс?

Intel i7 3770K + ASRock Z77 Extreme6 + DDR3 32Gb 2133MHz Team TXD332G2133HC11QC01 Xtreem(сейчас работает на частоте 1866MHz). На тот момент были деньги и я решил что для игрушек это подходящий процессор. Я тогда не подозревал что через пару лет этот комп станет моей рабочей станцией. Кстати проц без разгона, также кулер-башня с двумя вентиляторами(здоровая башня, места между ней и крышкой почти нет и это в Full Tower корпусе). Но память я так думаю сбоит из-за перегрева, так как оба раза проблемы были летом при жаре, хоть у меня и стояло тогда 4 120мм вентилятора и 4 92мм вентиляторы.

V1KT0P ★★
()
Ответ на: комментарий от V1KT0P

Если внимательно разобраться, то окажется что там не все так хорошо. Да ошибки возможно детектить(если подобрать определенную модель материнки), но никто не гарантирует этого. Гарантия только что можно вставить плашку памяти ECC и она будет работать как обычная. Ни о каком восстановлении единичных ошибок и речи не идет.

С ThreadRipper то же самое. Нужен ECC - ищи мать, которая поддерживает ECC.

Кстати, насколько я понимаю, ни в Ryzen ни в ThreadRipper нет поддержки синего экрана при неисправимой ошибке, только исправление ошибок, которые можно исправить? Или ошибаюсь?

Legioner ★★★★★
() автор топика
Ответ на: комментарий от Legioner

С ThreadRipper то же самое. Нужен ECC - ищи мать, которая поддерживает ECC.

Действительно не все материнки поддерживают ECC, на первый взгляд 50%, что вроде неплохо. Нагуглить таблицу с поддержкой ECC в X399 материнках не смог, только один форум с кое какой информацией: https://hardforum.com/threads/x399-mb-ecc-confirmation-clarification-thread.1...

V1KT0P ★★
()
Ответ на: комментарий от V1KT0P

Я по интересующим меня материнкам качал мануалы и смотрел конкретно в главу про память. В каких-то была упомянута ECC-память, в каких-то нет. Хотя лучше всего, конечно, реальные отзывы.

Legioner ★★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.