LINUX.ORG.RU

Проблема — может, с железом?


0

0

Есть проблема, видимо, нечто связанное с железом. Может, кто чего посоветует?

Суть проблемы такова:

На пустом месте на _некоторых_ машинах иногда валится задача. Однако, валится не всегда, а чаще всего просто выдает неверные ответы. При этом:

1. Только на трех машинах ( из двух десятков). На других такого нет. Даже более более того, на группе из 4 АБСОЛЮТНО одинаковых машин (AMD Athlon XP 3000+) задача систематически валяет ваньку -- на всех, кроме одной, на которой все ok. То есть, машины покупались одновременно, абсолютно одинаковые и с одинаковым Линухом.

2. "Ванька" абсолютно неповторима и появляется после 3-4 дней работы и десятков гигабайт переписанного дискового пространства.

3. uptime проблемных машин составляют месяцы; все, кроме нужной программы работает без проблем.

★★★★★

Возможно с памятью что... Поробуй memtest86 прогони, для уверенности сними модули памяти с одной из проблемных машин и поменяй их на снятые с нормально работающей станции.

Opg ★★
()
Ответ на: комментарий от Die-Hard

А процы-то крутые... Как у них сохдаждением? Какая температура, чё lm_sensors говорят? Кулеры-то нормальные? Или может сами процы с глюками?... Вряд ли...

snigga ★★★
()
Ответ на: комментарий от snigga

snigga (04.11.2004 20:04:40):

Все в порядке с процами, другие-то задачи идут без проблем.

В программе сидит баг, это понятно. Непонятно другое: почему он проявляется именно на этих трех машинах?

Die-Hard ★★★★★
() автор топика
Ответ на: комментарий от Die-Hard

Хм... Ну, если это в программе глюк, то видимо он достаточно хитрый. Скорее всего он с таким же супехом может проявитьсяна других машинах... Или какое-то совпадение... Отлаживать надо прогу... Я в этом не спец.

snigga ★★★
()
Ответ на: комментарий от snigga

snigga (04.11.2004 22:46:21):

> Скорее всего он с таким же супехом может проявитьсяна других машинах...

Статистика накоплена достаточно большая: ВСЕ прогоны на этих 3 машинах дают неверный результат, но ВСЕ прогоны на других машинах дают верный результат. Десятки прогонов на каждой машине!

Die-Hard ★★★★★
() автор топика
Ответ на: комментарий от Die-Hard

Может собрать програмку под mcpu=i686 march=i386?

И второй вопрос - не может ли у вас там проявляться race condition?

jackill ★★★★★
()

А если банально - сничить частоту шины и понизить можность процов? при этом заменить блоки питания?

также советую посмотреть на кондеры вокруг сокетного гнезда - отнести платы в ремонт

l-xoid ★★★★★
()
Ответ на: комментарий от jackill

jackill (05.11.2004 8:05:18):

> Может собрать програмку под mcpu=i686 march=i386?

А что это даст?

> И второй вопрос - не может ли у вас там проявляться race condition?

Вроде, негде: все однопроцессорное/однопроцессное.

Die-Hard ★★★★★
() автор топика
Ответ на: комментарий от Die-Hard

напиши в рассылку для меня - напиши какая мать, память, точно проц и ядро, желательно чей блок питания - чем смогу помогу

у меня недавно фишка была - у компа сгорел блокпитания, а новый поставить не могу - не стартует, винт заменить тоже не могу, протмучился недельку - взял мать и к знакомому ремонтнику. в итоге замена кондеров и все заработало нормально

l-xoid ★★★★★
()
Ответ на: комментарий от Die-Hard

Это даст более медленную, но более стабильную работу :)

jackill ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.