Добрый день!
Насколько критично в пределах одного хоста иметь разные диски под OSD? Сам массив у нас состоит из 9 нод, на 3-х из них стоят мониторы. Изначально в каждом сервере у нас стояло по 14 дисков объемом в 900Гб и 4 диска SSD объемом в 200Гб под журналы. 4 OSD приходились на 1 SSD. Постепенно у нас начались появляться сообщения о переполнении тех или иных OSD, reweight делать я не стал. Решили накинуть HDD, но были в наличии тогда объемом только 1,8Тб. Поставили их по 4 штуки на 3 сервака, SSD добавлять не стали. Сейчас теперь пытаюсь понять, столкнулись с тем, что при обновлении с Hammer на Jewel, используя флаги noout и norebalance, когда я тушил OSD на одном из серверов, у которых есть диски 1,8Тб у меня начинает повисать работа серверов в OpenStack (релиз Newton). Сами виртуалки выдают окно приглашения и пингуются, но провалится в них все равно нельзя. По мониторингу вижу на таких виртуалках большой процент по ожиданиям io. В кластере Ceph у нас используется распределение сетей, под кластерную сеть у нас собрано в агрегацию round-robin 2 оптических интерфейса по 10G. Под публичную сеть пока 1 гигабитный интерфейс без агрегации (в будущем будем тоже переводить на агрегацию по оптике). Вообще даже не только при этом обновлении, но и ранее когда выбивалась одна из нод Ceph'a, мы сразу это замечали, сервера в OpenStack моментально повисают, пингуются, выдают приглашение для ввода логина с паролем, но дальше уже провалится нельзя, клиент SSH просто висит. На некоторых виртуальных серверах потом можно заметить различные сообщения kernel task blocked for more than 120s для разных утилит. Пока причину такого поведения виртуальных серверов в OpenStack'e при вылете одной из нод в массиве, мы не можем найти. Так же забыл написать, на данный момент у нас 138 OSD, PG 6656, 4 пула и osd pool size = 3 (для любого пула). Основной посыл темы конечно узнать стоит ли использовать разные диски в массиве, но и если кто-нибудь может подсказать в какую сторону рыть по поводу повисания виртуалок, буду очень благодарен.
Ответ на:
комментарий
от Pinkbyte
Ответ на:
комментарий
от Deleted
Ответ на:
комментарий
от amkgi
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.
Похожие темы
- Форум Ceph в статусе OK, но появился флаг «nearfull». И как правильно исключать ноду из кластера. (2018)
- Форум [javascript] Измение строки адреса в пределах одного хоста (2012)
- Форум SSH к разным хостам по одному IP (2007)
- Форум Переключить работающее приложение с одного X-сервера на другой, в пределах одного хоста (2009)
- Форум /proc/1/statm и /sys/fs/cgroup паказывают разный объем использованной памяти (2020)
- Форум Две системы в одной или как одновременно использовать программы разных эпох (2017)
- Форум Инженер (направление CloudStack, Минск) (2015)
- Форум Openstack настройка сети (2015)
- Форум openstack homelab сеть (2015)
- Форум Senior CI Engineer (2015)