LINUX.ORG.RU
ФорумAdmin

Пропадают процессы, не закончившись

 , ,


2

4

Дано:

система ubuntu-20.04

железо: AMD FX(tm)-6300 Six-Core Processor,
M5A78L-M LE/USB3(bios - v5.02)

решил использовать этот комп для расчетов. Запустил 6 абсолютно одинаковых задачек моделирования чего-то. Разница только в начальном случайном числе.

вот, что показывает top:

Tasks: 239 total,   6 running, 233 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0,0 us,  0,6 sy, 82,9 ni, 16,5 id,  0,1 wa,  0,0 hi,  0,0 si,  0,0 st
MiB Mem :   7680,0 total,    362,2 free,   5360,9 used,   1956,9 buff/cache
MiB Swap:   8192,0 total,   7838,0 free,    354,0 used.   1999,8 avail Mem 

    PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND  
   3928 xxx       30  10 1099912 363192  22576 R 100,0   4,6   1164:37 root.exe 
   3923 xxx       30  10 1662268 404528   3640 R  99,7   5,1   1163:23 root.exe 
   3924 xxx       30  10 1636572 458604   6800 R  99,7   5,8   1164:09 root.exe 
   3927 xxx       30  10 1138156 375096   3628 R  99,7   4,8   1163:01 root.exe 
   3925 xxx       30  10   14,2g   3,3g   6672 R  94,4  43,6   1163:07 root.exe 

после 10ти часов счета отвалилась одна задача, как будто, ее убили kill’ом, и что-то стало происходить с распределением памяти для оставшихся процессов. Причем, подобное на этом компьютере случается не в первый раз.

На 3х других компах (2 Ryzen и AMD Phenom(tm) II X4) с абсолютно той же ОС такие фортели не наблюдаются задачи досчитываются с одинаковыми ресурсами используемой памяти до конца. Например, на AMD Phenom(tm):

 top - 11:25:18 up 20:07,  1 user,  load average: 4,03, 4,03, 4,00
Tasks: 209 total,   5 running, 204 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0,2 us,  1,2 sy, 98,5 ni,  0,0 id,  0,0 wa,  0,0 hi,  0,2 si,  0,0 st
MiB Mem :   7937,5 total,    924,3 free,   2208,4 used,   4804,8 buff/cache
MiB Swap:   8192,0 total,   8192,0 free,      0,0 used.   5428,3 avail Mem 

    PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND  
   3470 xxx       30  10  890304 399592  16428 R  99,7   4,9   1172:04 root.exe 
   3473 xxx       30  10  890600 393624  16664 R  99,7   4,8   1172:24 root.exe 
   3471 xxx       30  10  898620 436972  14196 R  98,7   5,4   1173:05 root.exe 
   3472 xxx       30  10  890064 393388  16756 R  98,3   4,8   1172:41 root.exe 

Вопрос: это железо или софт?

P.S.dmesg кроме warning о ACPI (на который иностранный народ советует забить, если присутствуют lm-sensors, а они есть

Перемещено hobbit из general



Последнее исправление: hobbit (всего исправлений: 3)

Ответ на: комментарий от targitaj

оно давно толком не работает

Конкретный пример можно?

memtest долбит разными числами каждый адрес памяти сравнивая считанное с посланным числом. Что здесь может не работать?
ЕСС только позволяет раньше заметить, что «что-то пошло не так» - я правильно понимаю? А всякие контролеры и драйверы направлены в основном на распараллеливание записи/считывания для увеличения скорости обмена данными с памятью.

valentin630
() автор топика
Ответ на: комментарий от valentin630

У меня интернет появился дома в 90х тогда, когда он только появился в РФ. Для воспитанного интеллигентного человека никогда «нормой» не может быть тыканье старшим и незнакомым людям. Не забывайте, что за каждым ником живой человек а не придуманный Грефом для нашего президента ИИ.

Эх, вам конечно поднахамили, но в принципе можно на эту тему и поговорить. «Вы» на Русь принес из Европы Петр-I с кучей других крайне сомнительных новшеств, вроде запретов бороды и русской одежды и многого другого. До него «ты» говорили даже царям и это не было неуважением, а просто русский язык такой.

Ну да ладно. Что же по теме, то тут остается только логировать действия программы. Чтобы хотя бы понять в какой момент она сваливается.

Кроме проблем с памятью могут быть и глюки CPU. Вы уверены, что он точно считает? Попробуйте запустить Linpack на компьютере. Можете посмотреть как я это делал здесь Потестил Ryzen 3900X интеловским Linpack-ом

Про глюки говорю потому, что заметил при попытках разгона, что зачастую вроде бы стабильно работающий компьютер может начать выдавать ошибки в операциях с плавающей запятой и это не всегда заметно. В случае линпак сразу можно увидеть рост невязок в ходе решений при глюках.

Ну или какую-то другую программу, плотно нагружающую процессор, все его ядра, вычислениями с плавающей точкой. Тут кстати есть нюанс, что AMD FX 6300 (и другие FX, архитектуры Бульдозер) имеют особенности в FPU, что их в два раза меньше формального числа ядер. У 6300 - как бы 6 ядер, но только 3 FPU блока. Может что-то с этим связано.

praseodim ★★★★★
()
Последнее исправление: praseodim (всего исправлений: 1)
Ответ на: комментарий от valentin630

ЕСС только позволяет раньше заметить, что «что-то пошло не так» - я правильно понимаю?

Нет, не правильно. ECC-память (обычная) может корректировать один бит ошибки на одно машинное слово. Сразу два ошибочных бита в одном слове она уже не скорректирует, но позволит заметить факт ошибки. Но и вероятность такого события намного ниже, чем порча только одного бита.

В общем, ECC для научных вычислений это то, что кажется, по-хорошему, просто необходимым. К сожалению, у нас по разным причинам ученые зачастую довольствуются довольно слабенькими машинами и ни о какой ECC и речи нет.

Еще отдельный вопрос к процессору. Некоторые изредка выдают ошибку в операциях с плавающей точкой, причем даже не грубую, а просто портятся несколько младших разрядов мантиссы и это сложно заметить, вылазит только в стресс-тестах вроде линпака с полной нагрузкой.

praseodim ★★★★★
()
Ответ на: комментарий от greenman

Смотрю озадачено на Ваш ник. С «зелеными» я познакомился в Германии в начале 90х. Насколько они адекватны до сих пор для меня загадка.

В воскресенье нужно после тренировки было решено купить алкоголь, но проблема в том, что в воскресенье ни один продовольственный магазин не работает, алкоголь в виде пива продается только на заправках. Когда я сказал своей спутнице, немецкой аспирантке, члену партии зеленых, что ничего не понимаю в сортах пива на заправке, она сказала, что все отлично знает и уверенно выбрала сорт пива. Попробовав это далеко не дешевое пиво, я не нашел в нем ничего особенного, поэтому спросил девушку, почему она выбрала, именно, это. Ответ был, что это пиво разлито в специальные многоразовые бутылки…

valentin630
() автор топика
Ответ на: комментарий от praseodim

Спасибо за интересные комментарии, но я человек старой закалки, твердо верящий, что «компьютер не ошибается», а оверклокеров считаю детьми, играющими в свои игрушки - когда оно рванет?
В моей практике еще не было случая, когда бы компьютер «считал неправильно». Если такое происходит, то либо нарушены технические нормы его эксплуатации, либо это ошибка программы. За достаточно долгую практику в мире ЭВМ, я не слышал ни от коллег, ни сам не сталкивался со случаем, что компьютер выдает разные результаты для одной и той же задачи. Наш мир построен на вероятностях, но если вы на краю распределения, то вероятность превысить среднее значение этого распределения ПРАКТИЧЕСКИ нулевая, создатели электроники знают об этом, стараясь близко не подходить к пороговым значениям, теряя устойчивость процесса.
Как я заметил, здесь есть участники и с однобитовым мышлением юнца, футбольного фаната: «спартак (Intel) - чемпион, ЦСКА (AMD) - конюшня», уверяя, что только из 5 АМD можно найти один, который стабилен. Надеюсь, Вы не разделяете этого мнения?
Я уже почти полностью уверен в причине происшедшего с моими задачами, это не железо, это алгоритмы с дырками в логике. И в этом мне помог форум, сам бы я не полез смотреть так глубоко историю на консоли.

valentin630
() автор топика
Последнее исправление: valentin630 (всего исправлений: 2)
Ответ на: комментарий от valentin630

Да, нашли к чему прикопаться, я в восторге.

Вот была такая тема

Один эпизод о достижениях современного глюководства

При работе через драйвер ntfs появлялись ошибки в файлах. memtest86+ ничего не находил.

Если лень читать всё, вот промежуточный итог:

Один эпизод о достижениях современного глюководства (комментарий)

greenman ★★★★★
()
Последнее исправление: greenman (всего исправлений: 2)
Ответ на: комментарий от greenman

Спасибо за ссылку на интересную историю. Между прочим, я задавал вопрос - а сколько времени нужно гонять memtest86? В описанном случае, скорее всего ошибка была связана с относительно долговременными колебаниями электрических параметров внутри чипов памяти, которые оказались слишком близкими к пороговым значениям. Скорее всего это связано с температурным режимом, который влияет на свойства полупроводников.
К моему случаю это не имеет отношения (стабильная температура), а вот в том примере запросто.

P.S.Это была шутка, а не наезд.

valentin630
() автор топика
Ответ на: комментарий от valentin630

Спасибо за интересные комментарии, но я человек старой закалки, твердо верящий, что «компьютер не ошибается», а оверклокеров считаю детьми, играющими в свои игрушки - когда оно рванет?

Совсем старой закалки проверяли на логарифмической линейке, что там ЭВМ насчитала.

Насчет оверклокеров вы немного отстали от современных реалий, сейчас практически все пользовательские процессоры, кроме совсем слабых для офисных машинок, идут фактически с заводским разгоном. Есть конечно штатные параметры, то даже штатный же турбо буст частоты - де-факто разгон. Его конечно можно отключить. Тоже и памяти касается. Память с XMP-профилем - это фактически разогнанная память.

В моей практике еще не было случая, когда бы компьютер «считал неправильно». Если такое происходит, то либо нарушены технические нормы его эксплуатации, либо это ошибка программы.

Либо бракованый процессор (или память). Не лично в моей практике, но я о таких случаях слышал. Специально ставили задачу считать пару недель и потом обнаруживали расхождения.

Ошибка в вычислениях может долго не замечаться. Я имею ввиду, если ошибка не систематическая, а например, один раз на несколько триллионов операций вылезет.

Более того, в ряде случаев, она может даже не повлиять на конечный результат. Например, если считается что-то итерациями с хорошей сходимостью и на очередной итерации ошибка составит даже 10%-20% от значения, то может просто сколько-то лишних итераций произойдет.

praseodim ★★★★★
()
Ответ на: комментарий от valentin630

«компьютер не ошибается»

А зачем существует ECC память, только деньги стричь?

ECC рациональности пост

Насколько все же важна ECC-память

(На нормальных счётных кластерах такой вопрос не стоит, везде ECC. Поспрашивайте коллег.)

greenman ★★★★★
()
Последнее исправление: greenman (всего исправлений: 2)
Ответ на: комментарий от praseodim

сейчас практически все пользовательские процессоры, кроме совсем слабых для офисных машинок, идут фактически с заводским разгоном

Заявление качественного характера типа «обыкновенная стиральная машина» из рекламы удалителя накипи.

Есть конечно штатные параметры

Вот и приведите цифры «штатных» и не штатных, ну, тех после «заводского разгона». Желательно со ссылкой на документы.

Не лично в моей практике, но я о таких случаях слышал.

Можно ли понимать это не есть правило, а исключение из оного?

Ошибка в вычислениях может долго не замечаться. Я имею ввиду, если ошибка не систематическая, а например, один раз на несколько триллионов операций вылезет.

Лирика, учитывая гигагерцовые частоты операций - вычисления будут все ошибочные. Про вероятность ошибки должна быть не одна диссертация написана, там и формулы, и результаты тестов должны быть как для конкретных чипов так и для разных структур полупроводников в зависимости от всяких токов и напряжений.

Про турбо режим. Это не разгон, это экология, т.е. экономия потребления энергии дабы не усугублять потепление климата планеты. Насколько мне известно из «популярных» источников, то главная проблема увеличения производительности процессоров это отвод тепла, которое значительно растет с увеличением частоты смены состояния полупроводника.

valentin630
() автор топика
Ответ на: комментарий от valentin630

Заело? Или сисадмин в детстве обидел?

Даже если предположить, что человек, пользующийся Линуксом, не знает, что такое OOM Killer, это гуглится самым очевидным запросом из всех, и для этого не нужно быть сисадмином.

CrX ★★★
()
Последнее исправление: CrX (всего исправлений: 2)
Ответ на: комментарий от greenman

Спасибо за ссылку: «more than 8% of DIMMs affected by errors per year». Это из абстракта приведенного там исследования. Я не стал дальше читать и уточнять сколько этих ДИМов в одном ПК, потому что тогда можно прийти к выводу, что ничему верить нельзя, а вычислительные фермы должны постоянно сбоить и ЕСС тут не поможет.
Про ЕСС можно привести аналогию, что «лучше быть здоровым и богатым, чем бедным и больным».

valentin630
() автор топика
Ответ на: комментарий от PPP328

программировает не знает что такое ООМ, ECC и DIMM. Это прекрасно.

знать, что такое ООМ, ECC и DIMM - это весьма похвально, но быть не в ладах с родным языком - это печально.

Любезнейший Вы наш,
не сочтите за труд объяснить, а зачем, например, программисту С++ или другого языка высокого уровня знание тонкостей перечисленных аббревиатур? Начинаю догадываться, что Вы также хорошо знакомы с диаграммами Феймана, я угадал?
Заранее спасибо.

valentin630
() автор топика
Последнее исправление: valentin630 (всего исправлений: 1)
Ответ на: комментарий от valentin630

зачем, например, программисту С++ или другого языка высокого уровня знание тонкостей перечисленных аббревиатур?

Может затем, чтобы писать не как макака, а понимая что делаешь?

диаграммами Феймана, я угадал?

А я не физик ядерщик. А вот например про физические явления пьезоэлектричества, строение кристаллической решетки и как его поляризовать рассказать могу.

но быть не в ладах с родным языком - это печально.

А вы, батенька, в интернет в первый раз зашли?

https://i.postimg.cc/vT4BQMc7/image.jpg

Поупырьте мел, вам тут никто ничего не должен.

PPP328 ★★★★★
()
Ответ на: комментарий от valentin630

что такое ООМ, ECC и DIMM

а зачем, например, программисту С++ или другого языка высокого уровня знание тонкостей перечисленных аббревиатур?

Вы серьёзно сейчас?

bugfixer ★★★★★
()
Последнее исправление: bugfixer (всего исправлений: 1)
Ответ на: комментарий от valentin630

Слушайте, Валентин Александрович, вас уже забанили на 4pda и ubuntu.ru и еще хрен пойми где и вы уже ходили хныкаться на форум gigabyte где вам уже тоже предъявили за вашу манеру речи. Вы пришли на форум, где сидят люди, которые по своей доброй воле отвечают или не отвечают на вопросы исходя из своего опыта. Вам уже ответили на ваш вопрос - ваши кривые поделия текут по памяти и падают по ООМ. Есть вероятность что в памяти проваливаются биты, но низкая, отсутствие ЕСС вам не даст проверить что-то через memset, такие времена давно прошли.

А при переходе на личности и выпячивании своего «авторитета» публично вы делаете всем смешно.

PPP328 ★★★★★
()
Последнее исправление: PPP328 (всего исправлений: 1)
Ответ на: комментарий от PPP328

О, да это же тот провинциальный модер с ubuntu.ru, забанивший меня навсегда за то, что я, якобы, сумел сам стать модером и отменил взыскания, наложенные другим модером. Браво, у меня появился биограф, огорчает только, что злобный.

valentin630
() автор топика
Ответ на: комментарий от valentin630

Не угадали. То, как отвратительно вы относитесь к сетевой безопасности позволяет легко найти ваше место работы, должность и кучу сайтов где ваш аккаунт имеет статус «забанен». Поэтому не стоит грубить и нахалить в интернете, потому что всегда найдется неадекват, который придет к вам под забор и будет ждать, пока вы выйдете из отдела экспериментальной физики высоких энергий чтобы предъявить вам за базар. А в 70+ лет тяжело будет отбиться.

PPP328 ★★★★★
()
Ответ на: комментарий от valentin630

а зачем, например, программисту С++ или другого языка высокого уровня знание тонкостей перечисленных аббревиатур?

Зачем программисту на C++ знать, что такое ООМ? Это серьёзно такой вопрос?

Aceler ★★★★★
()
Ответ на: комментарий от valentin630

Заявление качественного характера типа «обыкновенная стиральная машина» из рекламы удалителя накипи.

Грубо говоря, сейчас универсальные x86-е процессоры делятся на а)для офисных рядовым сотрудникам «печатные машинки» - это всякие целероны, атомы, пентиумы, райзены младших моделей. б) «игровые» - что-нибудь начиная с Core i5 у интела и Ryzen 5. - это то, что массы покупают в основном в) для рабочих станций и особо требовательных энтузиастов - HEDT сектор у Intel, Ryzen Threadripper у AMD г) серверы и особо крутые рабочие станции - Xeon у Intel, Epyc у AMD

Я не учитываю разные случаи для встраиваемых систем и прочие специальные ниши.

Так вот, «игровые» штатно обычно могут разгоняться при повышении нагрузки и насколько разгонятся, по большому счету, зависит от мощности системы охлаждения.

Можно ли понимать это не есть правило, а исключение из оного?

Нельзя. Потому что космические лучи - это не исключение, а то почему даже совершенно исправные компьютеры могут давать сбой и почему для ответственных вычислений совершенно необходима ECC память.

Статьи на эту тему тоже пишутся. Поищите по словам Cosmic Ray CPU soft error.

Например,

Scaling trends of cosmic ray induced soft errors in static latches beyond 0.18 μ https://www.researchgate.net/publication/3903596_Scaling_trends_of_cosmic_ray...

Soft Errors in Modern Electronic Systems https://www.scribd.com/document/338539263/Soft-Errors-in-Modern-Electronic-Sy... (статья недоступна из России)

Есть патенты на эту тему https://patents.google.com/patent/US8108714B2/en

Это так навскидку. Отдельно по памяти встречал исследование (ссылку сейчас лень искать, примерно 2007 года статья), что для DDR2 памяти объемом 8 Гб из-за космического излучения вероятность 90% что в течение года произойдет минимум один сбой. С одной стороны вроде мало, с другой как посмотреть. Тем более с тех пор и объемы стали больше и размеры ячеек меньше, так что вероятность сбоя должна была повыситься.

Не случайно вообще есть тема радиационно-стойких микросхем. Она более всего актуальна для космического оборудования, так как поверхность Земли все же защищена атмосферой и магнитным полем. Но и до нее много чего долетает.

На практике все еще хуже, потому что потребительская электроника сейчас, строго говоря по старым нормам, бракованая в большинстве, просто брак не вылезает сразу.

И это не шутки. Это фактор, который многие ученые недооценивают, что-то считая на своих компьютерах. По хорошему из-за этого, действительно ответственные расчеты надо повторять минимум дважды и очень желательно на разных компьютерах. В России, к сожалению, все усугубляется финансовым положением в которое поставлена наука, из-за чего ученые вынуждены вести расчеты на всяком старье, никогда даже не предназначавшемся для научных расчетов. В этом смысле сейчас хуже, чем в 90-е, тогда зарплата была копеечная, но оборудование, как ни странно, приобреталось относительно на уровне. Например, в лаборатории где я тогда проходил практику и потом некоторое время работал, стояли современные на то время компьютеры от DEC и Sun, а к «писюкам» относились снисходительно, так документики набить или что-то несложное посчитать.

Про турбо режим. Это не разгон, это экология, т.е. экономия потребления энергии дабы не усугублять потепление климата планеты.

Это вообще не причем. Современный Turbo Boost - это именно подъем частоты в случае интенсивных вычислений. Обычного одного-двух ядер из нескольких.

praseodim ★★★★★
()
Последнее исправление: praseodim (всего исправлений: 2)
Ответ на: комментарий от praseodim

космические лучи - это не исключение, а то почему даже совершенно исправные компьютеры могут давать сбой

До последнего времени, пока сбои компьютера случались о-очень редко, я сам себе и другим именно космическими мюонами и объяснял их. Вероятность такого процесса можно попробовать посчитать, но, если вы вспомните как часто считает счетчик Гейгера атмосферные мюоны, то можно сделать поспешный вывод, что комп должен постоянно сбоить. Однако этого не происходит, потому что сечение взаимодействия мюона с веществом мало.

То, что я здесь описал вышло в моем понятии за рамки случайности, больше, я вспомнил, что такое же явление было и на другом компе: у одной или нескольких задач происходит увеличение используемой памяти, но они досчитывают и правильно до конца, но при этом одна-другая может исчезнуть, вероятно, убитые ООМ.
Первое, странно, что в системе не остаются следы этого насилия, а, второе, сама причина увеличения памяти - это какой-то код в памяти портится и начинает запрашивать динамически новую память, но не всем процессам подряд, а потом исправляется? По моему, не похоже, что причина здесь в порче бита в ячейке памяти.

Тут мой биограф упомянул о моей теме на форуме Гигабайта (я свой ник не меняю). Сейчас не помню деталей, но мне яро доказывали, что память барахло, мол покупай хорошую, и не пудрь мозги трудящимся сисадминам и ученым сборщикам компов. Дело было в том, что две линейки памяти не хотели вместе работать на этой материнке гигабайтовской, а на другой, не гигабайтовской с другим чипом работали! Недавно освежал БИОС, увидел, что были у фирмы улучшения по совместимости памяти. Взять и свалить на память всегда проще, чем попытаться найти настоящую причину. К сожалению, часто это делается безаппеляционным образом, а если оппонент не согласен, то надо его давить, переходя на личности.

valentin630
() автор топика
Последнее исправление: valentin630 (всего исправлений: 1)
Ответ на: комментарий от valentin630

Однако этого не происходит, потому что сечение взаимодействия мюона с веществом мало.

Настолько ли мало, чтобы совсем не опасаться? К тому же там не только мюоны. В любом случае это явление учитывается, в 2020-м году даже международный стандарт на оборудование связи вышел New ITU standards to prevent soft errors caused by cosmic rays https://www.itu.int/hub/2020/05/new-itu-standards-to-prevent-soft-errors-caus...

То, что я здесь описал вышло в моем понятии за рамки случайности, больше, я вспомнил, что такое же явление было и на другом компе: у одной или нескольких задач происходит увеличение используемой памяти, но они досчитывают и правильно до конца, но при этом одна-другая может исчезнуть, вероятно, убитые ООМ.

То что здесь это конечно не космические лучи. Про них я вспомнил в контексте, что ошибки, хотя и очень редкие, но могут быть даже у совершенно исправной техники при правильной эксплуатации.

Здесь на английском довольно подробно про OOM Killer и журналирование событий https://www.baeldung.com/linux/which-process-killed

Первое, странно, что в системе не остаются следы этого насилия, а, второе, сама причина увеличения памяти - это какой-то код в памяти портится и начинает запрашивать динамически новую память, но не всем процессам подряд, а потом исправляется? По моему, не похоже, что причина здесь в порче бита в ячейке памяти.

По большому счету, все что точно известно - это что задача падает, досрочно завершаясь. Нет даже уверенности, что ее именно OOM прибивает. Я бы вставил в программу вывод отладочной информации по ходу работы. Добавив туда и объем памяти и прочее. И постарался бы все-таки какие-то коды возврата получить.

Дело было в том, что две линейки памяти не хотели вместе работать на этой материнке гигабайтовской, а на другой, не гигабайтовской с другим чипом работали! Недавно освежал БИОС, увидел, что были у фирмы улучшения по совместимости памяти.

На практике от конечного пользователя то, что происходит внутри железяк сейчас хорошо скрыто. Что там за несовместимость была,что именно гигабайт поправила в BIOS - неизвестно. По сути, с точки зрения эксплуатации оборудования, надо было менять или память или плату (т.к. не имелось еще биоса с исправлением ошибок).

praseodim ★★★★★
()
Последнее исправление: praseodim (всего исправлений: 1)
Ответ на: комментарий от rupert

Вы упрощаете, «сисадмин» для меня это понятие собирательное.
Люди, занимающиеся администрированием той или иной вычислительной системы, общей в смысле употребления, прекрасно понимают, что они в этом бизнесе ОБСЛУГА тех, кто делает основные дела. С этим развивается чувство собственной неполноценности, которое реализуется на форумах. Особенно вредны такие индивиды в роли модераторов, где их комплекс может быть компенсирован властью судить других.

valentin630
() автор топика
Ответ на: комментарий от peregrine

Последнее, что я мог увидеть на том сайте, что был забанен модером из Ростова-на-Дону, который никак не участвовал в дискуссии. Если Вы даете руку на отсечение, что это совпадение, то у меня нет оснований Вам не верить. Про тот форум могу добавить, что он полностью купленный, потому что в личном сообщении один из модераторов мне написал, что есть указания как реагировать на те или иные вещи, поэтому объективности ожидать не стоит. Кстати на англоязычном форуме ubuntu совсем другая атмосфера, в смысле вежливости и посылания в Гугл, но ответа оттуда приходится ждать через день, а то и два (Америка, да и меньше экспертов). Но тем, кто не работал там не понять их атмосферу официальной вежливости против раздражения здесь, что ты сам не сумел найти ответ на свой вопрос

valentin630
() автор топика
Ответ на: комментарий от valentin630

Дядь, а мне кажется вы балабол. Уж не знаю кем форум купленный и что за модератор вас там обидел, но в обсуждении модераторов данного ресурса я не видел ваши претензии.

peregrine ★★★★★
()
Ответ на: комментарий от peregrine

Вот оно - начинаются обзывалки.

обсуждении модераторов данного ресурса я не видел ваши претензии.

Какая наивность! Вам перекрыли там ВСЕ, даже возможность читать.
Косвенное доказательство, это то, что в качестве логина у меня на на том форуме был указан рабочий имейл, к которому, наверняка есть доступ модератору. А этот тип точно назвал мое место работы, да еще и пригрозил физической расправой. Так что выбирайте выражения…

Что меня обсуждать, когда поднятый вопрос так и остался открытым. Вчера пропали 2 процесса опять бесследно, остальные 8 считают как ни в чем ни бывало. Ни в dmesg, ни в journalctl нет никаких следов ошибок или ООМ.
Stout и вывод самой задачи пишутся в файл. Никаких сообщений, кроме вывода информации самой задачи, который просто обрывается. Люди тут советовали что-то поставить внутрь программы, но что именно - для меня этой информации было недостаточно, потому что я не представляю логику действий. Единственное, что известно, что задачи вылетели не одновременно, а с интервалов в 3 часа. В syslog в период времени вылетания задач нет ничего криминального.

Вопрос остался - может ли сама система linux убивать чужие процессы по собственной инициативе, не оставляя никаких сообщений об этом?

valentin630
() автор топика
Последнее исправление: valentin630 (всего исправлений: 1)
Ответ на: комментарий от valentin630

. А этот тип точно назвал мое место работы, да еще и пригрозил физической расправой. Так что выбирайте выражения…

У вас паранойя. Еще раз вам говорю, вы вышли в интернет с полным отсутствием знаний о сетевой безопасности (как, впрочем и о программировании). Достаточно вбить в гугл ваш никнейм, чтобы он выдал 3-4 форума где вы заблокированы за нахальное поведение. Также гугл выдает страницу МГУ, в котором расписаны ваши должность, адрес работы, даже конкретная лаборатория. А фамилия подтверждается тем, что вы (опять же нихрена не смысля в сетевой безопасности) на ubuntu форуме в каждом логе палили свой home user name, который совпадает с вашей фамилией. А возраст вы зачем-то указали на форуме строительства и коммуникаций.

Ну и да, я вам не угрожаю, я рассказал какие люди есть в интернете, которым вы максимально облегчили работу по вашему поиску.

PPP328 ★★★★★
()
Ответ на: комментарий от shTigrits

Да, с SSD, но только пишет туда. Если это ошибка обмена, то она ДОЛЖНА где-то отображаться

Пока комп не перегружался. Вопрос - как найти причину убиения невинной программы системой?

valentin630
() автор топика
Последнее исправление: valentin630 (всего исправлений: 2)