распределенные файловые ситсемы, что есть?

ceph, distributed systems, glusterfs, storage, файловая система

0

3

пробовал ceph и gluster. ceph с rbd map продолжает писать (вроде, хоть и подвисает вначале) когда нода фейлиться, что продолжает это +, но тут slow request'ы и не совсем очевидно почему оно периодически тормозит, зависимостей выявить не удалось. gluster проще ceph, но сразу перестаёт писать если нода зафейлилась, похоже он просто так устроен.

Что ещё есть из нормальных, что можно поставить и использовать без замут?

Ссылка

←	проверить убунту на руткиты

graphite + grafana - взять данные из графита по определенному условию

→

drbd?

ugoday ★★★★★
(17.04.18 16:18:22 MSK)

Ссылка

Google File System

~~Deathstalker~~ ★★★★★
(17.04.18 16:23:28 MSK)

Ссылка

Чо уж там, хадуп. Будет чотко.

stave ★★★★★
(17.04.18 16:26:56 MSK)

Ссылка

slow request'ы и не совсем очевидно почему оно периодически тормозит

Гайды профилировки достаточно подробно описывают что делать. Сеть 10Гб/сек ?

Pinkbyte ★★★★★
(17.04.18 16:33:19 MSK)

Ответ на: комментарий от Pinkbyte 17.04.18 16:33:19 MSK

К сожалению нет, 1Гб/сек, не могли бы вы привести ссылку где описана эта рекомендация?

VoDD87 ★
(17.04.18 17:17:33 MSK) автор топика

похоже он просто так устроен

Похоже, нужно сначала почитать документацию. Например, о таймаутах.

post-factum ★★★★★
(17.04.18 17:21:30 MSK)

Ответ на: комментарий от post-factum 17.04.18 17:21:30 MSK

Похоже, нужно сначала почитать документацию. Например, о таймаутах

приводите ссылку - почитаю.

VoDD87 ★
(17.04.18 17:25:13 MSK) автор топика

Ответ на: комментарий от VoDD87 17.04.18 17:25:13 MSK

LMGTFY?

post-factum ★★★★★
(17.04.18 17:42:49 MSK)

Ответ на: комментарий от post-factum 17.04.18 17:42:49 MSK

LMGTFY

Посмотрел, но это не относится к тому, что при выходе из строя ноды запись и чтение замирают на подмонтированный раздел замирают.

VoDD87 ★
(17.04.18 17:45:19 MSK) автор топика

Ответ на: комментарий от VoDD87 17.04.18 17:45:19 MSK

Ну вот расскажи мне детальнее, что к чему не относится, а я послушаю. Да так, чтобы конкретики поменьше: layout, опции, вот это вот всё — кому оно надо, правда?

post-factum ★★★★★
(17.04.18 17:47:02 MSK)

Ответ на: комментарий от post-factum 17.04.18 17:47:02 MSK

Ну вот расскажи мне детальнее

Мы тут не лечим мою конфигурацию, а больше обсуждаем варианты, но если gluster должен писать без задержек при падении одной из двух нод (не той к которой я подключен) с репликацией на обе - так прямо и скажите, что задержек быть не должно, но этого я пока от вас не увидел.

VoDD87 ★
(17.04.18 17:53:20 MSK) автор топика

Ссылка

Ответ на: комментарий от VoDD87 17.04.18 17:17:33 MSK

http://docs.ceph.com/docs/jewel/start/hardware-recommendations/

Consider starting with a 10Gbps network in your racks.

Вариант LACP с двумя гигабитными сетевухами стоит рассматривать ТОЛЬКО если у тебя там кластер на поиграться без реальных данных.

У меня у самого на паре нод - транки. Помогают они примерно НИКАК, при замене дисков(или еще при каком массовом ресинке - вводе новой ноды в эксплуатацию например) ноды без 10гб сети приходится гасить и подымать потом ночью, чтобы всё засинкалось. Иначе оно тормозит перманентно. Приоритеты на синхронизацию понижены через конфиг, чуть лучше чем без этого, но всё равно не помогает. Караван идёт со скоростью самого медленного верблюда - лучше сразу делать по уму, чем потом страдать.

Pinkbyte ★★★★★
(17.04.18 20:12:30 MSK)
Последнее исправление: Pinkbyte 17.04.18 20:16:55 MSK (всего исправлений: 3)

Ответ на: комментарий от Pinkbyte 17.04.18 20:12:30 MSK

Спасибо за опыт!

VoDD87 ★
(18.04.18 10:40:06 MSK) автор топика

Ссылка

6 декабря 2018 г.

Ответ на: комментарий от Pinkbyte 17.04.18 20:12:30 MSK

Уважаемый Pinkbyte, скажите, опрашиваю ceph через nginx->radosgw при запросе на чтение данных, скажем файл на 100MiB ceph читает данные со всех OSD на которых лежат эти данные? У меня каждая копия данные хранится на 3х OSD (разные сервера) одновременно. И я вот думаю, когда идет запрос мы передаем в итоге 300MiB между нашими серверами, или ceph выбирает с какой OSD читать и читает только один раз эти 100MiB только с одной OSD?

Вообще где можно почитать про алгоритм работы ceph при чтении данных? А быть может мне нужно читать про алгоритм работы radosgw? На сколько я понимаю radosgw коннектитися к одному из мониторов и забирает данные через монитор, так что все же наверно про ceph.

Заранее, и еще раз - спасибо!

VoDD87 ★
(06.12.18 12:07:41 MSK) автор топика

Ответ на: комментарий от VoDD87 06.12.18 12:07:41 MSK

Я думаю начать чтение следует с официальной документации по архитектуре ceph. Картинки там достаточно наглядные. Если вкратце - мониторы рассказывают клиенту с каких OSD нужно забирать данные.

Не знаю как сейчас, но раньше чтение было только с primary osd(что такое primary osd рассказано в документации), которые выставлялось для каждой placement group через CRUSH

Pinkbyte ★★★★★
(06.12.18 14:08:58 MSK)
Последнее исправление: Pinkbyte 06.12.18 14:11:04 MSK (всего исправлений: 1)

Ссылка

Не использовать ФС, а использовать key-value хранилища.

anonymous
(06.12.18 14:18:59 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	проверить убунту на руткиты

Admin

graphite + grafana - взять данные из графита по определенному условию

→

Похожие темы