Мгновенный бекап

1

2

Приветствую! Ситуация такая, есть linux машина с файлом в несколько килобайт, есть сервис, который отслеживает изменения файла в realtime. Как только файл был изменен сервис запускает команду по копированию этого файла на другой сервер в сети интернет. Потенциально файл может меняться часто (например пару раз в секунду) и мне важно иметь актуальный бекап этого файла на другой машине. Вопрос, как сделать копирование максимально быстрым. Я знаю, что если я буду копировать с помощью ftp, то какое-то время уйдет на установление соединения, может секунда или даже две. Можно ли как-то сократить эти технические издержки на установление соединения или может есть какой-то другой способ быстро скопировать маленький файл?

Ссылка

←	Прокси, который...

systemd-networkd не создаёт статические маршруты

→

какой-то другой способ быстро скопировать маленький файл?

Git диффы шпарит. Через него должно быть быстрее.

anonymous
(24.10.19 00:14:20 MSK)

Правильный ответ: открыть соединение заранее.

Полезный ответ: пересмотреть архитектуру этого ужаса, а то чую по постановке вопроса, останешься ты как-нибудь с неконсистентным бэкапом у разбитого корыта.

Огласи настоящую задачу, короче.

t184256 ★★★★★
(24.10.19 00:17:10 MSK)

Ответ на: комментарий от anonymous 24.10.19 00:14:20 MSK

Григорий Остер, залогиньтесь.

t184256 ★★★★★
(24.10.19 00:17:40 MSK)

Ответ на: комментарий от t184256 24.10.19 00:17:40 MSK

Григорий Остер

Промазал :)

anonymous
(24.10.19 00:20:32 MSK)

Ссылка

Вопрос, как сделать копирование максимально быстрым.

неправильный вопрос, правильный: «как сделать копирование максимально надёжным»

anonymous
(24.10.19 00:58:00 MSK)

Ответ на: комментарий от t184256 24.10.19 00:17:10 MSK

Правильный ответ: открыть соединение заранее.

Как это можно сделать в скрипте?

Огласи настоящую задачу, короче.

Это бекап off-chain data сервиса lnd (lightning network) Не думаю, что это многим будет о чем-то говорить. У сервиса встроенная система бекапа в файл на локальный диск.

samson_b ★
(24.10.19 00:59:59 MSK) автор топика

Ответ на: комментарий от anonymous 24.10.19 00:58:00 MSK

неправильный вопрос, правильный: «как сделать копирование максимально надёжным»

Надежным это само собой, но мне надо сделать его максимально быстрым.

samson_b ★
(24.10.19 01:01:59 MSK) автор топика

Ссылка

Ответ на: комментарий от samson_b 24.10.19 00:59:59 MSK

У сервиса встроенная система бекапа в файл на локальный диск.

В Linux нет принципиальной разницы между локальным и удаленным диском.

aquadon ★★★★★
(24.10.19 01:11:15 MSK)

Ответ на: комментарий от aquadon 24.10.19 01:11:15 MSK

Ок, хорошо. Какое решение лучше подойдет для моей задачи, чтобы использовать удаленную файловую систему как локальную? Повторю, мне важно, чтобы изменение файла сразу отражалось на HDD другого сервера.

samson_b ★
(24.10.19 01:56:26 MSK) автор топика

DRBD

anonymous
(24.10.19 02:05:28 MSK)

Ссылка

Ответ на: комментарий от samson_b 24.10.19 01:56:26 MSK

Для адекватного ответа недостаточно входных данных. Пока что это выглядит как какой-то костыль. Я лишь отметил, что если

У сервиса встроенная система бекапа в файл на локальный диск

то можно примонтировать удаленный диск (SSHFS, NFS) и будет уже удаленный бекап. Но его консистентность вызывает вопросы.

aquadon ★★★★★
(24.10.19 02:08:26 MSK)

Ответ на: комментарий от aquadon 24.10.19 02:08:26 MSK

aquadon, спасибо за ответы.

Для адекватного ответа недостаточно входных данных. Пока что это выглядит как какой-то костыль.

Да, так и есть, сама софтинка еще молодая, работаю с тем, что есть.

то можно примонтировать удаленный диск (SSHFS, NFS)

Прочитал, они мне оба понравились. Не понимаю какой выбрать :) С одной стороны NFS лучше, т.к. не нагружает проц, но мне не нравится, что там авторизация происходит по IP, а статического IP у клиента нет. Используя DDNS можно частично решить проблему, но обновление DNS записей может занять время и бекап не будет работать.

samson_b ★
(24.10.19 03:13:33 MSK) автор топика

Ответ на: комментарий от samson_b 24.10.19 03:13:33 MSK

С одной стороны NFS лучше, т.к. не нагружает проц, но мне не нравится, что там авторизация происходит по IP, а статического IP у клиента нет.

Подними VPN, заодно зашифруешь.

NFS в Hard режиме твой выбор, ИМХО.

Aceler ★★★★★
(24.10.19 03:45:45 MSK)

Ссылка

Смотря насколько далеко ты готов зайти. Идеальное техническое решение: написать своё приложение с шарингом сжатых диффов по пиринговому протоколу.

~~InterVi~~ ★★★★★
(24.10.19 05:50:00 MSK)

Ответ на: комментарий от InterVi 24.10.19 05:50:00 MSK

Нет.

Идеальное решение для ОП - не написать свой Syncthing.

Идеальное решение для ОП - понять, что консистентность он проигрывает в хлам, и замутить протокол, в котором он никогда не останется ни с половиной бэкапа, ни с рассинхроном бэкапа. Никаких файлов, никакой такой лабуды, куда большее время ожидания со стороны генерирующего софта. Возможно что-то из области СУБД подойдёт из коробки.

Сейчас же это звучит так, как будто при отключении питания ТС потеряет данные и локально, и удаленно.

ТС, на сколько записей допустимо в твоей задаче удалённому бэкапу отстать от локального? Если на 0, то вся твоя схема на файлах никуда не годна.

t184256 ★★★★★
(24.10.19 07:43:14 MSK)

Ответ на: комментарий от t184256 24.10.19 07:43:14 MSK

замутить протокол?

почему бы просто не писать временный файл, а при успешной его записи делать mv tmp real.

deep-purple ★★★★★
(24.10.19 07:49:31 MSK)

В идеале - то, что меняет файл, должно кидать эти изменения и на удаленный сервер с таймстампом.

Если такой возможности нет и костылей не избежать, то вполне сойдёт простое клиент-сервер приложение, которое будет держать постоянное соединение. Клиент пусть кидает содержимое файла, благо это несколько килобайт, ну и с временной меткой, естественно. Гит, как выше предлагали, тоже сойдёт, но, мне кажется, он будет отрабатывать не так быстро, как хотелось бы.

~~evgeny_aa~~ ★★☆
(24.10.19 08:04:52 MSK)

Ссылка

Храни файл на zfs, дергай снапшоты,пересылай снапшоты на другую машину. Как результат - всегда можно откатиться на требуемый снапшот и иметь бэкап. Или используй версионную фс, типа nilfs2(хз стабильная ли она вообще).

Deleted
(24.10.19 08:32:48 MSK)

Ответ на: комментарий от deep-purple 24.10.19 07:49:31 MSK

Ну вот смотри.

Предположим, что приложение ТСа все из себя замечательное, запись файла всегда проходит по всем канонам, никакого рассинхрона с внешним состоянием нет, все кэши сбрасываются по всем правилам, красота. И mv атомарен. И приложение само делает этот mv. И все остальные протоколы общения с внешним миром грамотны и работают в рамках тех же транзакций.

Приложение начинает писать tmp на диск, закончило fwrite, сбрасывает кеши, и тут вдруг пропадает питание. Мы загружаемся, отбрасываем tmp, используем real. Где-то далеко по таймауту TCP отваливается наш собеседник, но он так и не получил отмашки, что у нас все дошло до диска, откатывает транзакцию и понимает, что когда мы опять будем в сети, мы будем ни сном, ни духом о ней.

Классно? Да, но при такой схеме и степени продуманности обычно механизм транзакционности впекается в формат файла / СУБД и не нужно делать mv tmp real.

А теперь давай смотреть, что будет, если хоть один из наших пунктов нарушен.

Если приложение ТСа просто сохраняет что-то на диск, не заботясь о его консистентности в процессе записи, продолжая фигачить дальше, то твой mv - хорошая идея, но от всех проблем не спасет. Пример: вот ты грузишься после хардресета, у тебя на диске tmp и real. Сколько транзакций будет потеряно, если ты рестартанешь с real?

Если приложение ТСа ведет себя идеально, но про mv не знает? Hard reset между окончанием записи и успешным завершением mv - и ты теряешь транзакцию.

Если правильной (и сложной) синхронизации с остальным взаимодействием нет, и внешние ресурсы могут оказаться в заблуждении о том, что ты учел транзакцию, а ты перезагрузился и откатился, то пошел рассинхрон. От которого еще можно спастись костылями, но еще сложнее, чем предотвратить.

Если mv неатомарен, то вообще капец.

А теперь смотрим на задачу ТСа. У него так хрен бы знал что, а потом scp prod remote:bak процессом, не знающим даже когда читать этот prod. Толку от такого «бэкапа» - спокойный сон до обнаружения того, что он, естественно битый. Которое случится, когда что? Правильно, побьется prod. И во избежание вероятной депиляции его задницы мы обязаны в такой схеме отговаривать его от всего, что не является ни штатно реализованной схемой бэкапа в самом приложении, ни бэкапом из остановленного состояния.

ТС, не делай глупостей.

t184256 ★★★★★
(24.10.19 08:46:56 MSK)

https://github.com/axkibe/lsyncd

ValdikSS ★★★★★
(24.10.19 09:00:40 MSK)

Ссылка

Ответ на: комментарий от t184256 24.10.19 08:46:56 MSK

а ты зацепился за потеряную транзакцию, давай спросим у тса, не плевать ли ему на пропуски состояний? главное, mv атомарен на уровне фс, ее кешей, кешей диска и всего такого.

deep-purple ★★★★★
(24.10.19 09:06:47 MSK)

Ответ на: комментарий от deep-purple 24.10.19 09:06:47 MSK

Ну допустим ему плевать на пропуски. Сформулирую проще.

ТС пытается постоянно копировать грязную базу, ибо не имеет снаружи от программы представления о том, когда она консистентна. Он может снаружи хоть уmvкаться. Даже если он, не знаю, снапшоты ФС применит и тем самым решит проблему того, что файл меняется, в самом-самом идеале у него будет атомарная немного несвежая копия грязного снапшота базы.

Можешь оспорить? Я что-то упускаю?

t184256 ★★★★★
(24.10.19 09:15:23 MSK)

Ответ на: комментарий от t184256 24.10.19 09:15:23 MSK

я это не оспариваю, а лишь говорю, что, походу ему плевать на пропустить пару состояний.

deep-purple ★★★★★
(24.10.19 09:22:39 MSK)

Ответ на: комментарий от deep-purple 24.10.19 09:22:39 MSK

А я из «Потенциально файл может меняться часто (например пару раз в секунду) и мне важно иметь актуальный бекап этого файла на другой машине. Вопрос, как сделать копирование максимально быстрым.» предполагаю, что ему не плевать и это именно что такой его способ избежать пропуска пары состояний.

t184256 ★★★★★
(24.10.19 09:26:41 MSK)

Ответ на: комментарий от t184256 24.10.19 09:26:41 MSK

)))

да сам заголовок треда в ступор может ввести - что есть мгновенно?

deep-purple ★★★★★
(24.10.19 09:28:58 MSK)

Ответ на: комментарий от deep-purple 24.10.19 09:28:58 MSK

В теории для общего случая непрозрачного приложения - до окончания сигнализации конца записи приложению. Возможно даже еще до наступления пятницы.

В мире ТС - быстрее, чем он успеет заметить, т.е. много быстрее, чем сейчас =)

t184256 ★★★★★
(24.10.19 09:33:37 MSK)

Ссылка

А если мы начали копировать файл, половину скопировали, и тут процесс его перезаписал — в бекапе будет каша?

Nervous ★★★★★
(24.10.19 09:36:41 MSK)

бекап всегда делается в одно и тоже имя файла ?

Есть ли вероятность, того что новый бекап будет записан в тот же самый файл во время копирования на другой сервер ?

vel ★★★★★
(24.10.19 10:19:02 MSK)

Ссылка

Поднимаете Ceph, натягиваете CephFS, файл выкладываете на неё, и оригинальный файл делаете симлинком :-)

Nastishka ★★★★★
(24.10.19 12:07:58 MSK)

Ответ на: комментарий от Nervous 24.10.19 09:36:41 MSK

«если»? =) ты хотел сказать «как часто» =D

t184256 ★★★★★
(24.10.19 12:16:32 MSK)

Ответ на: комментарий от t184256 24.10.19 12:16:32 MSK

«если»? =) ты хотел сказать «как часто» =D

Я просто не в курсе, может, там какие-то нюансы есть. Если так, то, видимо, этот путь заведомо проигрышный и надо мутить что-то вроде очереди сообщений.

Nervous ★★★★★
(24.10.19 12:27:57 MSK)

Ссылка

ФС со снепшотами. Перед копированием файла - делаешь снепшот, из снепшота копируешь файл, снепшот удаляешь. Как отследить событие записи файла - ну тебе или inotify прикручивать, или разбираться со своей программой.

Deleted
(24.10.19 12:38:13 MSK)

Ответ на: комментарий от Deleted 24.10.19 08:32:48 MSK

Идея с log-structured FS действительно вкусная в теории, ведь позволяет получать консистентные версии файла безотносительно того, как та программа пишет на диск. Ещё бы была какая-нибудь стабильная log-structured fs, которая умела бы синхронизоваться…

t184256 ★★★★★
(24.10.19 12:39:42 MSK)

Ссылка

Ответ на: комментарий от Deleted 24.10.19 12:38:13 MSK

Ну и от чего именно тут спасают снапшоты? =)

t184256 ★★★★★
(24.10.19 12:41:16 MSK)

Ответ на: комментарий от t184256 24.10.19 12:41:16 MSK

От изменения файла во время копирования.

Deleted
(24.10.19 12:52:46 MSK)

Ответ на: комментарий от Nastishka 24.10.19 12:07:58 MSK

Удваиваю cephfs. Страдать, так страдать по полной, ещё и потратив тонну денег.

Deleted
(24.10.19 15:33:43 MSK)

Ссылка

Ответ на: комментарий от t184256 24.10.19 07:43:14 MSK

Это если совсем по-хорошему. Если он сам пилит свою блокчейн-фигню, то так и надо было делать изначально.

~~InterVi~~ ★★★★★
(24.10.19 19:42:37 MSK)

Ссылка

Ответ на: комментарий от Deleted 24.10.19 12:52:46 MSK

И как ты узнаешь, в какой момент состояние на диске консистентно? Значит не спасает.

t184256 ★★★★★
(25.10.19 08:05:23 MSK)

Ответ на: комментарий от t184256 25.10.19 08:05:23 MSK

После изменения файла тут же сделать снепшот. Снепшот делается рассказать как? А потом из снепшота уже доставать файл.

Deleted
(25.10.19 10:56:07 MSK)

Ответ на: комментарий от Deleted 25.10.19 10:56:07 MSK

Ты не знаешь, в какой момент данные консистентны => будешь снимать снапшоты каши.

А если оно консистентно всегда, то достаточно и mv.

Снапшоты ничего не решают, они бы пригодились разве что для совокупности файлов.

t184256 ★★★★★
(25.10.19 12:41:48 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Прокси, который...

Admin

systemd-networkd не создаёт статические маршруты

→

Похожие темы