LINUX.ORG.RU
решено ФорумAdmin

Help!!! segfault

 


0

1

Парни помогите.

Feb 24 14:57:08 iht kernel: amavisd[5049]: segfault at 802e0b97c ip 00007ff086582ba0 sp 00007fffc9e641e0 error 6 in libperl.so[7ff0864a$
Feb 24 14:57:08 iht kernel: amavisd[5028]: segfault at 802e0b97c ip 00007ff086582ba0 sp 00007fffc9e641e0 error 6 in libperl.so[7ff0864a$
Feb 24 14:57:09 iht kernel: amavisd[5069]: segfault at 802e0b97c ip 00007ff086582ba0 sp 00007fffc9e641e0 error 6 in libperl.so[7ff0864a$
Feb 24 14:57:10 iht kernel: amavisd[5071]: segfault at 802e0b97c ip 00007ff086582ba0 sp 00007fffc9e641e0 error 6 in libperl.so[7ff0864a$
Feb 24 14:57:11 iht kernel: amavisd[5074]: segfault at 802e0b97c ip 00007ff086582ba0 sp 00007fffc9e641e0 error 6 in libperl.so[7ff0864a$
............ + еже строк 30 с интервалом от секунду до нескольких секунд. Логватч иногда выплевывал что была ошибка, но это были единичные случаи (одна две в неделю, а то и реже) и все продолжало работать. Теперь начало падать и добавилось segfault на clamd dovecot postfix. Я понимаю что нужно начать с ОЗУ, но сейчас нельзя останавливать. Любые идеи. Спасибо!!

CentOS 6.5 8GB ОЗУ.

  • clamav-0.98-1.el6.x86_64
  • perl-5.10.1-136.el6.x86_64
  • amavisd-new-2.8.0-4.el6.noarch
  • postfix-2.6.6-2.3.el6.x86_64
  • dovecot-2.0.21-0_136.el6.x86_64
  • spamassassin-3.3.1-3.el6.x86_64

ИМХО, без вариантов, перегружаться и тестировать память.

Вроде как с битой памятью летать можно, если заблочить битые области через параметр командной строки ядра memmap, определив их через memtest, хотя сам подобные эксперименты не ставил. Ещё давно был патчи badmem и badram, но, уже давно умерли.

Но, чтобы на ходу на обычном ядре с обычной памятью определить проблемные области и перестать их использовать, я про такое не слышал.

И, по мне, работать на глючной памяти может быть черевато порчей данных.

mky ★★★★★
()
Ответ на: комментарий от mky

Ясно. Понял что без остановки никак. Спасибо что отозвались.

smokin
() автор топика
Ответ на: комментарий от anonymous

В dmesg segfault amavisd, clamd, clamscan. Читать аудит то еще удовольствие.Там в основном сессии полицида, нетфилтр, немного моих сессий.

smokin
() автор топика
Ответ на: комментарий от anonymous

Хотя покопавшись в audit нашел

 type=ANOM_ABEND msg=audit (1393467320.768:2583): audi=0 uid=496 gid=496 ses=98 pid=28624 comm="clamscan" sig=11
 type=ANOM_ABEND msg=audit (1393467478.830:2584): audi=0 uid=496 gid=496 ses=98 pid=28659 comm="clamscan" sig=11
 type=ANOM_ABEND msg=audit (1393468636.448:2585): auid=0 uid=496 gid=496 ses=98 pid=28775 comm="clamscan" sig=11
Тоже есть и со всеми моими проблемными сервисами.

smokin
() автор топика
Ответ на: комментарий от anonymous

В общем вот аудит. Подзабыл как правильно читать.

# aureport --start today --anomaly

Anomaly Report
=========================================
# date time type exe term host auid event
=========================================
1. 27.02.2014 00:48:28 ANOM_ABEND clamscan ? ? 0 2520
~~~
11. 27.02.2014 07:30:48 ANOM_ABEND clamscan ? ? 0 2635

# aureport --start 27.02.2014 -m AMOM_ABEND -a 2635 -i
---
type=ANOM_ABEND msg=audit (27.02.2014 07:30:48.242:2635) : auid=root uid=amavis gid=amavis ses=155 pid=29318 comm=clamscan sig=Ошибка сегментирования

smokin
() автор топика

Только поднимать рядом живой сервер и переносить всё туда, а потом уже не торопясь разбираться. 99% - память или другое железо(перегревшийся южный мост и т. п.).

selivan ★★★
()
Последнее исправление: selivan (всего исправлений: 1)
7 апреля 2014 г.

Может для кого то это и не новость,но накопал для себя когда боролся с проблемой интересный метод проверки ОЗУ. Его прелисть в том, что все можно провернуть на включенной машине, без ребута!!! В моем случае на проблемной машине суммы были всегда разные! Полюбопытствовать можно сдесь: http://www.cyberciti.biz/tips/howto-linux-server-memory-check.html и действительно при проверке мемтестером окзалась битая планка. В двух словах:

user@PrimePC:~$ free
             total       used       free     shared    buffers     cached
Mem:       2063584    1846516     217068          0      99708     694644
-/+ buffers/cache:    1052164    1011420
Swap:      4287484          0    4287484
user@PrimePC:~$ dd if=/dev/urandom bs=2063584 of=/tmp/memtest count=1050
1050+0 записей получено
1050+0 записей отправлено
скопировано 2166763200 байт (2,2 GB), 245,503 c, 8,8 MB/c
user@PrimePC:~$ md5sum /tmp/memtest
7f5bce2b0a7667b1d6fc0b7c692328bb  /tmp/memtest
user@PrimePC:~$ md5sum /tmp/memtest
7f5bce2b0a7667b1d6fc0b7c692328bb  /tmp/memtest
user@PrimePC:~$ md5sum /tmp/memtest
7f5bce2b0a7667b1d6fc0b7c692328bb  /tmp/memtest
user@PrimePC:~$ 

smokin
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.