LINUX.ORG.RU
ФорумTalks

PSI (Pressure Stall Information) для оффтопика

 , , ,


0

1

Приветствую!

⚠️ Disclaimer

Сразу хочу извинится, что вопрос по оффтопику, но этот вопрос смогут понять скорее всего только пользователи онтопика.

В гугле видимо меня забанили, найти не смог, а про форточки забыл я как про страшный сон. Да, и скорее всего выговориться просто нужно.

Суть проблемы, есть куча подвластных мне виртуалок (суммарно ядер на 300 и 0.8 Tb ОЗУ) работающих в не зоне моих полномочий, на серверах Hyper-V. Виртуалки неистово тупят, гипервизор крадёт все ресурсы, я даже боюсь представить насколько сильно они перепроданы. С одного запроса в простую веб-морду, порядка 30 GET на статику всякую и пару запросов в БД, в гостевой RHEL на CPU наблюдаю IO wait 100%. Естественно, когда туда идут коллеги работать по своим задачам, всё дико тупит и IO в потолке постоянно, мне кидают предъявы. Обидно.

Несколько недель у меня идут ожесточённые бои с админом офтопика. Я говорю - «ты душишь мои виртуалки», а он в ответ - «у меня всё работает, на против виртуалки горит зелёная лампочка».

Так вот, захотелось мне попросить, у него метрики по типу PSI Pressure Stall Information, во первых ему доказать, где и почему он не прав, а во вторых использовать это как аргумент к руководству. Но вот, что именно просить у него (в виндовой терминологии) я не знаю.

Работаем мы все в одной организации, и всё насквозь пропитано бюрократией, просто так, что то поменять здесь сложно. Да и админ скорее не из вредности, а просто по не опытности не может с этим, что-то сделать.


Если знает кто ответ, можете поделиться ссылкой на нужный мне документ. А коли мимо проходили, можете накинуть пару баек про виртуализацию на оффтопике и какие батхерты имели, и как с ними справлялись.

Всем добра.



Последнее исправление: WoozyMasta (всего исправлений: 1)

в гостевой RHEL на CPU наблюдаю IO wait

IO wait означает только то что у тебя много синхронного I/O и ничего более. Берешь fio и тестируешь диск (подсказка - в 1, 4, 8 и 16 потоков, random read-write, с direct=1 и (возможно) fsync=1 и fdatasync=1). На выходе получаешь IOPS и latency. Смотришь на цифры и если они плохие - с ними идешь к администратору виртуальной инфраструктуры и тычешь цифрами в рыло.

Nastishka ★★★★★
()
Ответ на: комментарий от Nastishka

Проходили, репортами от sysbench, fio и iperf3 (да там и с сетью беда) его уже завалил. Но у него зелёная лампочка светится и значит все ок.

Я хочу официальный запрос через руководство написать, пусть со своей стороны докажет, что я вру.

WoozyMasta
() автор топика
Ответ на: комментарий от WoozyMasta

Ну вот эти репорты и приложи к запросу, с обоснованием.

intelfx ★★★★★
()
Ответ на: комментарий от WoozyMasta

Ну так и пиши приложив цифры. В чем проблема то? У вас должно быть SLA на инфраструктуру - сколько иопсов на запись и на чтение и с каким латенси должно отдаваться, вот от этого и танцуй. А если SLA нет то вендоадмин прав - лампочка зеленая пинг есть - всё работает, и начинать надо с SLA - согласовываешь с начальством какой ио тебе достаточен, подписываешь и показываешь вендоадмину «вот согласованные боссом требования - " чувак, ты их не выполняешь для моих ВМ, будь добр исправить» и дальше это его головная боль выполнить требования

Nastishka ★★★★★
()
Последнее исправление: Nastishka (всего исправлений: 1)
Ответ на: комментарий от Nastishka

Вы абсолютно правы, всё так и есть, SLA есть но очень размытый, SLО не регламентирован, SLI процентный не предоставлен, если не считать мои письма в вольной форме с бенчмарками и скриншоты из мониторинга. В официальном же запросе, я все свои предыдущие и будущие замеры и показатели обязательно опубликую.

Но вот хочется мне, запросить информацию по метрикам с другой стороны, да так ловко, как-будто я и в винде мастак, для большей важности. Да и самому узнать, что за метрики виндовые нужны. Я догадываюсь, что это есть в perfmon, хз только как их зовут. Но если ни кто не подскажет, и на том спасибо.

WoozyMasta
() автор топика

Так наверно диски, где всё это расположено, и перегружены. Думаю это где-то в мониторинге той машины, которая их держит (либо хост гипервизора, либо отдельное схд), должно быть видно.

firkax ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.