LINUX.ORG.RU
ФорумTalks

[нужно][не нужно] Есть критерии использования ECC памяти?

 


1

1

Для каждого железа можно найти критерии использования, но для памяти ECC весь гуголь забит соплями на тему типа вон там серьезные дядьки с дорогими серваками, им нужно ECC чтобы спать спокойно, а хомячкам оно не нужно потому что дорого и непонятно. И почти все соплежуи в конечном итоге апеллируют к тезису «ынтерпрайзности» без какой-то конкретики, критериев и параметров.

Я так мыслю, что чем больше памяти (общей и используемой), тем выше вероятность возникновения ошибки. От какого объема стоит использовать ECC?

Какие еще есть конкретные критерии нужности/ненужности ECC на десктопе или производительной рабочей станции?

★★★★★

Последнее исправление: Lordwind (всего исправлений: 1)

Я почему-то всегда думал, что оно уже везде есть.

kompas
()

У каждой железки есть вероятность отказа/сбоя, которая указан в ТТХ. Выбор степени отказоустойчивости железа определяется требованиями отказоустойчивости к системе. Вот когда будет конкретное ТЗ на систему, тогда и можно будет смотреть нужно тут ECC или нет.

soomrack ★★★★
()

Критерий такой, если тебе идёт процент от продажи, то просто требуй, чтобы всё что можно было с ECC ибо без ECC это детский сад.
Если же тебе процент не идёт, то покупай простую память и не парься.

dimon555 ★★★★★
()

ждем тредов

«Есть критерии использования RAID?» «Есть критерии использования избыточного кол-ва PSU?» «Есть критерии использования промышленных систем охлаждения?» «Есть критерии использования горячей замены CPU?» «Есть критерии использования $X?»

exception13 ★★★★★
()

Я так мыслю, что чем больше памяти (общей и используемой), тем выше вероятность возникновения ошибки. От какого объема стоит использовать ECC?

ECC стоит использовать всегда, но не всегда получается. Например, нет ни одного лаптопа с ECC.

Есть случаи, когда без ECC вообще нельзя. Например, при работе с ответственными данными, когда битовая ошибка может привести к потере данных.

Сейчас объемы памяти вообще очень велики. Вероятность ошибки не такая уж маленькая. А память зачастую остается единственным компонентом компа без обнаружения ошибок!

Deleted
()
Ответ на: комментарий от dk-

а как проявляются сбои не-есс памяти? как могу узнать что вот он- сбой от памяти.

без ecc разве только по признакам ядреной паники либо искажениям данных если сбойный кусок памяти используется под буфер данных либо прочим спец-эффектам.

exception13 ★★★★★
()

От какого объема стоит использовать ECC?

от 256и Мб. Хотя проблема в том, что не получается...

drBatty ★★
()
Ответ на: комментарий от exception13

Все что перечислили более-менее ясно и понятно. Например критерий использования RAID - необходимость отказоустойчивой работы СХД, следовательно все задачи, требовательные к доступу 24/7 можно считать приоритетными и требующими RAID. А задач, требовательных к надежности работы с RAM чуть менее, чем дофига, потому что все так или иначе прокачивается через память.

Программные критерии контроля ошибок оперируют с данными из памяти без контроля целостности того, что было записано ранее в память и позже считано из нее, поэтому вся защита идет лесом. И главный фокус в том, что ошибки из RAM потом могут проявляться как ошибки ФС и любые другие и как их оценить изолированно никто не знает.

Lordwind ★★★★★
() автор топика
Ответ на: комментарий от dk-

а разве такие ошибки могут быть только в памяти?

угу. в HDD они проверяются. В памяти - нет. Кеш маленький, там вероятность ошибки невелика. ИМХО конечно. Хотя нормальная память и без сабжа работает... На практике.

drBatty ★★
()
Ответ на: комментарий от Lordwind

Программные критерии контроля ошибок оперируют с данными из памяти без контроля целостности того, что было записано ранее в память и позже считано из нее, поэтому вся защита идет лесом. И главный фокус в том, что ошибки из RAM потом могут проявляться как ошибки ФС и любые другие и как их оценить изолированно никто не знает

ну ещё никто не придумал, как сделать рабочую программу на кривом железе. и ЕСС тут слабо помогает.

drBatty ★★
()
Ответ на: комментарий от Lordwind

Программные критерии контроля ошибок оперируют с данными из памяти без контроля целостности того, что было записано ранее в память и позже считано из нее, поэтому вся защита идет лесом. И главный фокус в том, что ошибки из RAM потом могут проявляться как ошибки ФС и любые другие и как их оценить изолированно никто не знает.

ECC по крайней мере емнип гарантирует коррекцию данных в случае единичной или двойной ошибки (поправьте если ошибаюсь).

exception13 ★★★★★
()
Ответ на: комментарий от exception13

ECC не спасает от битой памяти, только помогает пережить косяки без серьезных последствий. Есть ошибки памяти нефизического характера, например от электромагнитных наводок. Чем больше памяти используется ОС/софтом, тем больше может быть косяков. Читал что реально видели разницу только на БД. Но на десктопе ведь бывают и другие вещи, файловый кеш, рам-диски и т.п.

Lordwind ★★★★★
() автор топика
Ответ на: комментарий от exception13

ECC по крайней мере емнип гарантирует коррекцию данных в случае единичной или двойной ошибки (поправьте если ошибаюсь)

Исправление 1 бита, обнаружение 2 бит

Lordwind ★★★★★
() автор топика
Ответ на: комментарий от Lordwind

Исправление 1 бита, обнаружение 2 бит

значит должен быть механизм сообщения о найденной ошибке. скорее всего через какой нить NMI

exception13 ★★★★★
()

Эта память вообще в повседневной работе стабильности добавляет или нет? Памяти 16 Гб. Процессор поддерживает ECC.

AlexVIP
()

Есть критерии использования ECC памяти?

Поставим вопрос иначе: критерий неиспользования ЕСС - если нужна очень высокая реалтаймовая производительность при невысокой важности обрабатываемых данных (т.е. для игр, обработки звука итп.). Во всех остальных случая лучше использовать ЕСС.

kranky ★★★★★
()

А кто-то уже терял важные данные из-за случайно ошибки на десктопе? Конечно, из-за нее может упасть плазма или сама ос а узнать об этом будет нельзя, но такой критичности я ни разу не встречал. Опять же при скачивании и\или сохранении данных на винт ошибка их повредит, но я такого ни разу не замечал.

KillTheCat ★★★★★
()
Ответ на: комментарий от KillTheCat

Некто бекапы записывал на DVD и 1 раз получил фейл. Еще есть мнение, что большой аптайм для десктопа часто прерывается всякими случайными мелкими косяками именно по причине обычной памяти.

Lordwind ★★★★★
() автор топика
Ответ на: комментарий от dk-

а как проявляются сбои не-есс памяти? как могу узнать что вот он- сбой от памяти.

Когда-то давно свой один такой сбой я искал очень долго. Почти неделю. Иногда вываливались експшены ядра, некоторый программы вываливались с ошибкой (непредсказуемо). Грешил на систему. Оказалась память. Прогнал тест на всю память (лимпак). Ошибки полезли только на третий день непрерывного теста. Заменил, все стало работать отл.

Проблемы с памятью можно обнаружить только если специально их искать. Хотя есть симптом — ошибки непредсказуемы, появляются случайно и при работе с разными приложениями. Т.е. если иногда творится какаято непредсказуемая, хаотичная ху*ня, то в*еби память, хотя бы для профилактики.

soomrack ★★★★
()
Ответ на: комментарий от kranky

Отличная постановка вопроса, так даже проще, есть где подумать.

очень высокая реалтаймовая производительность

Известно насколько сильно падает общая производительность памяти и снижает ли ECC скорость случайного доступа к памяти?

Lordwind ★★★★★
() автор топика
Ответ на: комментарий от Lordwind

Известно насколько сильно падает общая производительность памяти

Около 5%

снижает ли ECC скорость случайного доступа к памяти

Да

kranky ★★★★★
()
Ответ на: комментарий от anonymfus

В кешах и иногда даже регистровых файлах современных процессоров есть обнаружение ошибок.

пруф?

drBatty ★★
()
Ответ на: комментарий от dk-

А почему модули ддр3-ецц на 8гб значительно дешевле таких же без ецц?

Ссылку пожалуйста. Пойду туда памятью закупаццо.

kranky ★★★★★
()
Ответ на: комментарий от AlexVIP

Эта память вообще в повседневной работе стабильности добавляет или нет? Памяти 16 Гб. Процессор поддерживает ECC.

хз. аптаймы иногда по полгода, и без сабжа. УМВР.

drBatty ★★
()
Ответ на: комментарий от KillTheCat

А кто-то уже терял важные данные из-за случайно ошибки на десктопе?

я терял из-за битой памяти. лечится заменой памяти на нормальную (memtest поможет)

drBatty ★★
()
Ответ на: комментарий от Lordwind

Известно насколько сильно падает общая производительность памяти и снижает ли ECC скорость случайного доступа к памяти?

вроде не снижает. оно как я понял параллельно работает.

drBatty ★★
()
Ответ на: комментарий от dk-

Скорее всего ты смотришь Registered ECC, для которых нужны нибуевые ксеоны

Lordwind ★★★★★
() автор топика
Ответ на: комментарий от drBatty

аптаймы иногда по полгода, и без сабжа. УМВР

Видимо все зависит от того, как долго нечто находится в RAM. В обычных домашних условиях софт загружается/выгружается чаще, чем могут возникнуть косяки.

Lordwind ★★★★★
() автор топика
Ответ на: комментарий от Lordwind

Видимо все зависит от того, как долго нечто находится в RAM. В обычных домашних условиях софт загружается/выгружается чаще, чем могут возникнуть косяки.

не. дома таких аптаймов энергетики не дают добиться. и постоянные апгрейды. А вот на серверах - бывает. Если на них забить.

drBatty ★★
()
Ответ на: комментарий от dk-

а как проявляются сбои не-есс памяти? как могу узнать что вот он- сбой от памяти.

например, система начинает сильно свопить и безбожно тормозить - у меня так ноут себя начал вести. прошёл мемтестом - там просто ппц, портянка лога ошибок километровой длины.

Satan_Klaus ★★
()

Какие еще есть конкретные критерии нужности/ненужности ECC на десктопе или производительной рабочей станции?

а у меня на компе без вариантов - только ецц, с другой не работает.

Satan_Klaus ★★
()
Ответ на: комментарий от dk-

а разве такие ошибки могут быть только в памяти?

Нет, но остальные узлы имеют хотя бы обнаружение ошибок: процессор (хотя и не все одинаково полезны), шины, коммуникационные протоколы и т.д.

Deleted
()
Ответ на: комментарий от exception13

значит должен быть механизм сообщения о найденной ошибке. скорее всего через какой нить NMI

mcelog

Deleted
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.