12309?

0

1

На i5/32gb ram / ssd root при копировании через dd iso-образа дистрибутива на старый usb flash накопитель поймал 12309 - подлагивало курсор мыши, скроллинг в хроме педалил.Как еще можно воспроизвести этот баг, чтобы уже точно? В vmstat wa ~ 60-70 было.

Никаких прочих дисковых операций не было.

Ссылка

←	IPtables DNAT-перенаправление (проксирование)

Как управлять демонами в убунту?

→

Как вызвать этот баг — забить всю оперативную память приложениями и начать копирование на флешку или другой съемный носитель.

Но зачем? Чтобы побороть этот баг, надо пересобрать ядро с патчами, тут всё зависит от конкретного компьютера, но для чего его нужно вызывать ещё раз? Даже если во второй раз произойдет настоящий 12309, это не значит, что в первый раз это был он.

Vsevolod-linuxoid ★★★★★
(27.04.16 06:08:53 MSK)

Ответ на: комментарий от Vsevolod-linuxoid 27.04.16 06:08:53 MSK

У меня 27 гб свободной памяти. Нет дисковых операций. В iotop скорость записи была 4 мб/с. И я поймал его :)

~~int13h~~ ★★★★★
(27.04.16 06:24:35 MSK) автор топика

Ответ на: комментарий от int13h 27.04.16 06:24:35 MSK

Мля. У тебя поди dirty.ratio значения большие, только и делов. Это ты думаешь, что ты поймал баг, а на самом деле у тебя просто криво настроена система.

anonymous
(27.04.16 06:35:46 MSK)

Ответ на: комментарий от anonymous 27.04.16 06:35:46 MSK

Ущерб, уже разработчики ядра признали, что во wiriteback коде ядра есть проблема bufferbloat: https://lwn.net/Articles/681763

anonymous
(27.04.16 07:14:13 MSK)

Бро, бобро бомжаловать в клуб свистетелей ЕГО ЭТ САМОГО!

Да, оно самое.
у меня выскочило при копировании между блинам 2.5" сата.

да, / был на вертексе4, такие дела. [xeon1230/z97/32]

Deleted
(27.04.16 07:31:42 MSK)
Последнее исправление: RTP 27.04.16 07:34:02 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от anonymous 27.04.16 06:35:46 MSK

Тогда повара Убунты - кривые настройщики системы.
14.04 на тот момент.

что в ней настраивать?
накатил и забыл.
или ты предлагаешь ведро конпелять?

Deleted
(27.04.16 07:36:55 MSK)

Ответ на: комментарий от Deleted 27.04.16 07:36:55 MSK

Нахрен конпелять ядро не надо. Надо просто подправить ratio кешей в сторону уменьшения, тогда ядро не будет жестоко тупить и попёрдывать от охренения. Алгоритмы рассчитаны на более слабые машины, а подправить сейчас либо тяму не хватает у народа, либо никому это не надо особо.

В кратце, это, конечно, похоже на 12309, но по факту трабла возникает из-за слишком больших кэшей, которые система просто начинает сбрасывать на медленное устройство и тупит. Пользуйтесь sysctl. Вообще на 27 игах оперативки 10% dirty data (пусть даже и от кол-ва общей свободной памяти) как-то овердохера. И вот когда эти 2 гектара начинают сбрасыаться на тупую флэху со скоростью в 10 метров в секунду - наступает оверзвездец, пока не сбросятся. Дело в том, что буфер пытается наполниться быстрее. А из-за особенностей алгоритма система еще и в своп может уйти. Проще всего в такой момент приостановить копирование, дождаться окончания сброса dirty на диск и продолжить операцию, или держать побольше памяти занятой (/me вспоминает сброс кэша в 16 гиг на медленный девайс на большой машинке и нервно хихикает).

anonymous
(27.04.16 07:57:24 MSK)

Ответ на: комментарий от anonymous 27.04.16 07:14:13 MSK

А ты кукарекал бы еще больше. Эта проблема by design большей частью. И сказанное мной не отрицает того факта, что системе всё равно надо урезать объем dirty на большом количестве ОЗУ.

anonymous
(27.04.16 08:00:20 MSK)

Ответ на: комментарий от anonymous 27.04.16 08:00:20 MSK

Что на самом деле системе надо делать по ссылке разработчики ядра тоже написали.

anonymous
(27.04.16 08:21:31 MSK)

гугли на тему лаги+ntfs+linux. Старая хрень...

CHIPOK ★★★
(27.04.16 08:33:03 MSK)

вот норм статья https://habrahabr.ru/post/116601/

CHIPOK ★★★
(27.04.16 08:38:01 MSK)

Ответ на: комментарий от CHIPOK 27.04.16 08:33:03 MSK

Вот анонимус выше описал вроде толково появление сего лаго-глюка.
Но и от нтфс никуда не убежать. Даже если венды нет, то ФС вполне может быть нужна.

Deleted
(27.04.16 08:41:41 MSK)

Ссылка

Ответ на: комментарий от CHIPOK 27.04.16 08:38:01 MSK

насколько статья релевантна?
прошло уже 5 лет с момента публикации 1апр2011.

т.е. кто-то же должен был запостить репорт по профилю.

Deleted
(27.04.16 08:43:21 MSK)

scsi_mod.blk_mq=1 и все.

~~slaykovsky~~ ★★★
(27.04.16 08:43:23 MSK)

Ответ на: комментарий от anonymous 27.04.16 07:57:24 MSK

Херь это полная, ничего уменьшение dirty.ratio не помогает.

Deleted
(27.04.16 08:44:17 MSK)

Ответ на: комментарий от slaykovsky 27.04.16 08:43:23 MSK

Ага, если бы.

Deleted
(27.04.16 08:44:56 MSK)

Ответ на: комментарий от Deleted 27.04.16 08:44:56 MSK

Так ты не пробовал.

~~slaykovsky~~ ★★★
(27.04.16 08:47:03 MSK)

Ответ на: комментарий от Deleted 27.04.16 08:43:21 MSK

ну пусть ТС отпишется, у меня нет НТФС )))

CHIPOK ★★★
(27.04.16 08:48:50 MSK)

Ответ на: комментарий от slaykovsky 27.04.16 08:47:03 MSK

Правда штоле?

# cat /proc/cmdline
BOOT_IMAGE=../vmlinuz-4.5-x86_64 root=/dev/sda2 rootflags=subvol=root/manjaro-embryo,compress=lzo rw scsi_mod.use_blk_mq=1 zswap.enabled=1 quiet nosplash initrd=../initramfs-4.5-x86_64.img

Deleted
(27.04.16 08:52:00 MSK)

спуфинг-моде:

хипстота, понакупает ядер с гектарами, а потом плачется... со своими кремний-проблемами.

мониторы, мониторы покупать надо!!!

Deleted
(27.04.16 08:52:16 MSK)

Ссылка

Ответ на: комментарий от anonymous 27.04.16 08:21:31 MSK

То, что там написали - моим словам никак не противоречит на данный момент. В новых ядрах фиксится.

anonymous
(27.04.16 09:37:52 MSK)

Ссылка

Ответ на: комментарий от CHIPOK 27.04.16 08:48:50 MSK

dd, без фс

~~int13h~~ ★★★★★
(27.04.16 09:42:42 MSK) автор топика

Ссылка

Ответ на: комментарий от Deleted 27.04.16 08:44:17 MSK

Если у тебя _очень_ медленные устройства - тебе поможет только специальный патч. Есть в составе pf. Можешь еще увеличить таймауты сброса грязных данных на диск. Чтобы одновременно писалось только в один поток. Тогда увеличивай dirty ratio. Проблема заключается в том, что устройство, на которое идёт запись получает тонну одновременных запросов, а ядро тупит из-за особенностей этого алгоритма. Всё, что можно сделать - наложить патч соответствующий или попытаться минимизировать проблему за счет установки адекватных параметров через sysctl.

anonymous
(27.04.16 09:45:59 MSK)

Ответ на: комментарий от anonymous 27.04.16 09:45:59 MSK

У меня даже при активной работе с ssd фризы начинаются.

Deleted
(27.04.16 09:47:37 MSK)

Ответ на: комментарий от Deleted 27.04.16 08:52:00 MSK

zswap.enabled=1

Поражаюсь. А эта дрянь может и еще больше усугубить баг (почему - предлагаю догадаться самому). Ну так, к сведению. Кроме того, смысл в ней вообще сомнителен без большого кол-ва RAM (от 8 Гб и выше). То же относится и к zram.

anonymous
(27.04.16 09:47:57 MSK)

Ответ на: комментарий от Deleted 27.04.16 09:47:37 MSK

У меня даже при активной работе с ssd фризы начинаются.

И будут, пока noop вместо планировщика не поставишь.

anonymous
(27.04.16 09:49:30 MSK)

Ответ на: комментарий от anonymous 27.04.16 09:49:30 MSK

Ставил, только ещё хуже было. Сейчас вообще без планировщика. Стало получше, но всё равно.

Deleted
(27.04.16 09:51:52 MSK)

Ответ на: комментарий от anonymous 27.04.16 09:47:57 MSK

Не может.

Deleted
(27.04.16 09:52:32 MSK)

Ответ на: комментарий от Deleted 27.04.16 09:51:52 MSK

Ставил, только ещё хуже было. Сейчас вообще без планировщика. Стало получше, но всё равно.

Вообще-то noop - это и есть отсутствие планировщика. Скорее, у тебя SSD работает с особенностями и жёстко снижает скорость записи время от время от времени. Тогда интересны юзкейсы.

anonymous
(27.04.16 09:54:41 MSK)

Ответ на: комментарий от anonymous 27.04.16 09:54:41 MSK

Со скоростью самого ssd всё нормально. Это система фризится.

Deleted
(27.04.16 09:57:41 MSK)

Ответ на: комментарий от Deleted 27.04.16 09:52:32 MSK

Может. Это еще один буфер в ОЗУ. С которыми у линуха и так не очень в отдельные моменты времени. Понимаешь, проблема в ядре, которое не умеет нормально приоритеты сброса на блочное устройство. Можешь ядрышко и посвежее собрать, скажем так.

it basically won't start before the buffered writeback is done

Собственно, запись в своп - тоже еще один поток, если у тебя пространство в оперативке под zswap закончилось - лови 12309.

anonymous
(27.04.16 09:58:17 MSK)

сушайте, я тут уже проникся идеей быстрофикса.

втулить 2 планки по 4ГБ и все само собой заработает.

Deleted
(27.04.16 09:58:51 MSK)

Ответ на: комментарий от anonymous 27.04.16 09:58:17 MSK

Zswap просто сжимает страницы перед сбросом в своп. Он не помещает своп в оперативки.

Deleted
(27.04.16 09:59:49 MSK)

Ответ на: комментарий от Deleted 27.04.16 09:57:41 MSK

Если у него проседает скорость записи перед скоростью чтения (а такое возможно, когда trim еще не успел отработать, а запись идёт в блоки, которые нужно очистить - SSD вместо операции записи выполняет чтение -> стирание -> запись), тогда при переполнении буферов происходит как раз оно же самое. Ну и плюс ко всему, запись в общем-то медленнее. Можно вместо ratio (оно, кстати, считается не от объема всей памяти) установить вменяемое vm.dirty_background_bytes = 0 - ну, метров 100 скажем.Тогда тупить будет много меньше, т.к. writeback будет завершаться до того, как система словит тупняк.

anonymous
(27.04.16 10:02:21 MSK)

Ответ на: комментарий от Deleted 27.04.16 09:59:49 MSK

Zswap is a lightweight compressed cache for swap pages.

https://www.kernel.org/doc/Documentation/vm/zswap.txt

Да, прямо таки не помещает в оперативку. Ну-ну.

anonymous
(27.04.16 10:04:28 MSK)

Ссылка

Ответ на: комментарий от Deleted 27.04.16 09:58:51 MSK

Чем больше оперативки - тем больше вероятности словить эту хрень.

anonymous
(27.04.16 10:05:18 MSK)

Ссылка

Тем временем, https://github.com/pfactum/pf-kernel/commit/d37efc32606a2009f2d288499965cafa2...

post-factum ★★★★★
(27.04.16 10:05:43 MSK)

Ответ на: комментарий от post-factum 27.04.16 10:05:43 MSK

Да-да. Вот именно об этом я и говорю.

anonymous
(27.04.16 10:06:50 MSK)

Ссылка

Добавлю:

я писал с помощью dd — т.е. никаких фс не использовал на накопителе:

dd if=myiso.iso of=/dev/sdX

~~int13h~~ ★★★★★
(27.04.16 10:08:54 MSK) автор топика

Ответ на: комментарий от int13h 27.04.16 10:08:54 MSK

Это не на уровне ФС баг. Совсем не на уровне ФС. Можешь глядеть atop к примеру, в этот момент и увидеть, после какого момента у тебя dirty data достигает максимального значения и запись начинает идти не в один поток, а в несколько.

anonymous
(27.04.16 10:10:55 MSK)