Прога на Qt + БД SQLite: как сделать бекап из своего софта?

1

4

Всем привет.

Есть некая программа-сервис на Qt с базой данных SQLite. Эта программа должна автоматически делать бекапы своей БДшки по шедулеру. Но есть загвоздка, программа ведёт постоянный опрос всяких устройств, реагирует на происходящее с этими устройствами и к программе подключаются АРМы, на которых это происходящее отображается.

Есть ли какие-нибудь вменяемые способы реализовать такое бекапирование? В идеале, только средствами фреймворка, т.е. QtSQL.

Пока навскидку придумалось накостылить класс, который во время копирования файла БД будет у себя складировать все поступающие запросы, а по окончанию процесса их выполнит. Пока БДшка копируется, можно на АРМе крутить юзеру надпись а-ля «внимание, происходит резервное копирование БД» и блокировать интерфейс (со слов «заказчика», вариант допустимый).

Ссылка

←	Детект изменения состояния сетевых подключений

Пропадают символы в собираемых библиотеках.

→

Зачем такие сложности, когда можно просто копировать файл базы по таймеру (или вообще по крону)

annulen ★★★★★
(01.09.21 10:54:47 MSK)

Или даже делать это в онлайн режиме через https://www.sqlite.org/backup.html

А про QtSQL, если не предполагается использование других бэкэндов, лчучше вообще забыть

annulen ★★★★★
(01.09.21 10:58:18 MSK)

Ответ на: комментарий от annulen 01.09.21 10:54:47 MSK

А как быть с тем, что будут обращения к БД на запись во время копирования? Или оно это «само разрулит и ничего не поломает»?

s3rjke ★
(01.09.21 11:00:26 MSK) автор топика

Ответ на: комментарий от s3rjke 01.09.21 11:00:26 MSK

А как быть с тем, что будут обращения к БД на запись во время копирования?

Если делать копированием файла, то придется блокировать доступ на это время. Backup API, насколько я понимаю, не требует этого

annulen ★★★★★
(01.09.21 11:02:43 MSK)

Ответ на: комментарий от annulen 01.09.21 11:02:43 MSK

Если делать копированием файла, то придется блокировать доступ на это время.

Ну, собственно, проблема.

Backup API, насколько я понимаю, не требует этого

Хм. Вообще, судя по беглому гуглению, возможно эту штуку можно будет использовать совместно с Qtшными объектами для работы с БД. Придётся читать документацию, эх.

s3rjke ★
(01.09.21 11:07:27 MSK) автор топика

Нужно объяснить заказчику что профилактические меры требуют остановку работы приложения, и не мучаться. Чувствую, все эти костыли до добра не доведут.

neversleep ★★
(01.09.21 11:17:23 MSK)

Ответ на: комментарий от neversleep 01.09.21 11:17:23 MSK

Или менять СУБД. Совет хороший, конечно, понимаю.

neversleep ★★
(01.09.21 11:24:01 MSK)

Ссылка

Ответ на: комментарий от annulen 01.09.21 10:58:18 MSK

А про QtSQL, если не предполагается использование других бэкэндов, лчучше вообще забыть

Это почему?

rumgot ★★★★★
(01.09.21 11:52:08 MSK)

Что ты хранишь в базе? Т.е. будет ли база постоянно увеличиваться или нет? Если да и последует разрастание базы до десятков а то и сотен мегабайт, то лучше возьми тот же PosgreSQL/MySQL/MongoDB или еще что-нибудь, потому что получишь проблемы в виде тормозов при большом размере базы Sqlite. При этом у тех баз, что я написал, есть инструменты резервного копирования, не требующие прерывать работу с базой.

rumgot ★★★★★
(01.09.21 11:59:07 MSK)

По поводу решения в текущем виде. Можно делать выборку всех данных и вставлять в новую базу-резервную копию. Просто я бы файл не копировал.

rumgot ★★★★★
(01.09.21 12:03:43 MSK)

Ссылка

Ответ на: комментарий от s3rjke 01.09.21 11:07:27 MSK

Хм. Вообще, судя по беглому гуглению, возможно эту штуку можно будет использовать совместно с Qtшными объектами для работы с БД.

Можно. Но нужно убедиться, что QtSql и код, использующий sqlite напрямую, слинкованы с одной и той же библиотекой (ну или хотя бы одной и той же версией). На это можно напороться, используя бинарные сборки Qt от разработчиков

annulen ★★★★★
(01.09.21 12:34:39 MSK)
Последнее исправление: annulen 01.09.21 12:34:48 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от rumgot 01.09.21 11:52:08 MSK

Потому что это ненужный слой абстракции, мешающий полноценно использовать API sqlite (использование двух API сразу некрасиво и создает проблему, описанную выше), создающий гемор с деплойментом плагина для qtsql (или статической линковкой этого плагина), при этом заточенный на клиент-серверные базы. Ну и б-гомерзкие QVariant’ы в API, через которые надо гонять данные.

annulen ★★★★★
(01.09.21 12:41:39 MSK)
Последнее исправление: annulen 01.09.21 12:49:23 MSK (всего исправлений: 1)

Ответ на: комментарий от rumgot 01.09.21 11:59:07 MSK

Если да и последует разрастание базы до десятков а то и сотен мегабайт, то лучше возьми тот же PosgreSQL/MySQL/MongoDB или еще что-нибудь, потому что получишь проблемы в виде тормозов при большом размере базы Sqlite.

+1. Но если база раздувается не из-за количества строк, стобцов и таблиц, а из-за хранения в ней больших блобов, то можно хранить их во внешних файлах.

При этом у тех баз, что я написал, есть инструменты резервного копирования, не требующие прерывать работу с базой.

У sqlite тоже есть

annulen ★★★★★
(01.09.21 12:45:34 MSK)

Ссылка

Ответ на: комментарий от rumgot 01.09.21 11:59:07 MSK

Что ты хранишь в базе?

В основном бинарные данные, но в будущем там будет храниться и видео (короткие записи) и потенциально возможно разрастание до гигабайт.

лучше возьми тот же PosgreSQL/MySQL/MongoDB

Да вот пока вместе с моей программой ещё одну софтину тащить не хочется.

s3rjke ★
(01.09.21 13:05:36 MSK) автор топика
Последнее исправление: s3rjke 01.09.21 13:05:50 MSK (всего исправлений: 1)

Программа не должна самостоятельно ничего бекапить в идеале, это работа для внешнего сервиса, или скрипта, запускаемого по крону. Если БД небольшая, а она явно небольшая, учитывая, что ты используешь SQLite, можешь реализовать нечто наподобие ротации раз в день. Но что-то мне подсказывает, что тебе всё же стоит поменять БД, тогда проблема решился сама собой.

~~WitcherGeralt~~ ★★
(01.09.21 13:17:09 MSK)

Ответ на: комментарий от WitcherGeralt 01.09.21 13:17:09 MSK

Программа не должна самостоятельно ничего бекапить в идеале, это работа для внешнего сервиса, или скрипта, запускаемого по крону.

Я сначала такую же дичь сморозил, но если такой «внешний» бэкап произойдет в момент записи, то получится битый файл

annulen ★★★★★
(01.09.21 13:22:35 MSK)

Ответ на: комментарий от s3rjke 01.09.21 13:05:36 MSK

В основном бинарные данные, но в будущем там будет храниться и видео (короткие записи) и потенциально возможно разрастание до гигабайт.

В таком случае в базе нужно хранить строго метаданные

annulen ★★★★★
(01.09.21 13:23:19 MSK)

Ответ на: комментарий от annulen 01.09.21 13:22:35 MSK

Это не дичь. Читай сообщение дальше, осознаешь.

~~WitcherGeralt~~ ★★
(01.09.21 13:40:54 MSK)
Последнее исправление: WitcherGeralt 01.09.21 13:41:46 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от annulen 01.09.21 13:23:19 MSK

Всмысле, видеофайлы просто валить рядом, а в БДшке оставить пути к ним?

На сколько точны сведения, что SQLite будет тупить при разрастании БДшки? Давно гуглил эту тему, но жалоб вроде не было.

s3rjke ★
(01.09.21 13:47:23 MSK) автор топика

c 00 до 00:05 каждый день профилактика :) И копируй этот файлик…

anonymous
(01.09.21 13:47:44 MSK)

Ссылка

Ответ на: комментарий от s3rjke 01.09.21 13:47:23 MSK

Всмысле, видеофайлы просто валить рядом

у меня на наколенной поделке есть каталог, где файлики (картинки, пдфки и т.д. с именем = id в базе) и храняться…

Все норм… Но у меня не гигабайты и поделка однопользовательская…

anonymous
(01.09.21 13:50:25 MSK)

Ссылка

Если снаружи в кроне, то sqlite3 foo.db ‘.backup bar.db’, это онлайн-бэкап, не особо тормозящий основное приложение.

Ещё начиная с sqlite 3.27 имеем VACUUM INTO, можно его выполнить как из внешнего шелла по крону, так и из приложения.

Ещё есть собственно backup api https://www.sqlite.org/backup.html

LeninGad ★
(01.09.21 13:54:56 MSK)

Ссылка

https://www.sqlite.org/backup.html

~~Legioner~~ ★★★★★
(01.09.21 13:59:30 MSK)

Ссылка

Ответ на: комментарий от rumgot 01.09.21 11:59:07 MSK

Глупости. SQLite с большими базами справляется не хуже постгреса и уж тем более не хуже всяких монго. Алгоритмы там плюс-минус такие же. Никаких тормозов, обусловленных SQLite нет и быть не может. Инструменты резервного копирования у SQLite тоже есть.

Единственная причина, по которой SQLite может быть хуже, это параллельная работа на запись множества транзакций в одной таблице. Там версионная БД вроде постгреса будет выигрывать.

~~Legioner~~ ★★★★★
(01.09.21 14:01:17 MSK)
Последнее исправление: Legioner 01.09.21 14:02:11 MSK (всего исправлений: 1)

Ответ на: комментарий от s3rjke 01.09.21 13:05:36 MSK

В основном бинарные данные, но в будущем там будет храниться и видео (короткие записи) и потенциально возможно разрастание до гигабайт.

Имей в виду, что в SQLite ограничение в 2 ГБ на один блоб. При хранении видео можно в него упереться, будет неудобно обходить.

~~Legioner~~ ★★★★★
(01.09.21 14:03:29 MSK)

Ответ на: комментарий от annulen 01.09.21 12:41:39 MSK

Если у тебя уже используется Qt то думаю с красотой все нормально. С деплоем в виде разделяемых библиотек у меня проблем на винде и линуксе нету.

rumgot ★★★★★
(01.09.21 15:14:15 MSK)

Ссылка

Ответ на: комментарий от Legioner 01.09.21 14:01:17 MSK

Глупости

Теоретически то алгоритмы плюс-минус такие же. Но.

Вот я сделал сравнительные замеры, чтобы обсуждение в ДА-НЕТ не скатывалось.

Дано. Две базы PostgreSQL и SQLite. Созданы через функционал Qt SQL. Вот запрос на создание таблиц:

const QString createTablesQuery =
    "CREATE TABLE IF NOT EXISTS test_table ("
    "id SERIAL PRIMARY KEY,"
    "t0 TEXT NOT NULL,"
    "t1 TEXT NOT NULL,"
    "t2 TEXT NOT NULL,"
    "v0 INTEGER NOT NULL,"
    "v1 INTEGER NOT NULL,"
    "v2 INTEGER NOT NULL,"
    "v3 INTEGER NOT NULL,"
    "v4 INTEGER NOT NULL,"
    "v5 INTEGER NOT NULL,"
    "v6 INTEGER NOT NULL,"
    "v7 INTEGER NOT NULL,"
    "v8 INTEGER NOT NULL,"
    "v9 INTEGER NOT NULL,"
    "v10 INTEGER NOT NULL,"
    "v11 INTEGER NOT NULL,"
    "v12 INTEGER NOT NULL,"
    "v13 INTEGER NOT NULL,"
    "v14 INTEGER NOT NULL"
    ")";

Заполнил случайными числами. Там где строки, значения получались из случайных чисел с плавающей точкой путем конвертирования случайного числа в строку.

Диск у меня SSD если что.

Вставил в таблицу в каждой базе 10000000 записей и замерял время вставки каждой записи. Так вот при росте базы роста времени вставки нет ни у SQLite (~2-4мс) ни у PostgreSQL(0-1мс).

А вот далее идет выборка и тут уже интереснее.

Запрос:

const QString selectQuery = "SELECT * FROM test_table where t0 = ''" /*здесь ставлю разные значения*/;

Так вот. Далее буду подставлять в запрос выше значения, соответствующие первой, средней и последней записям в таблицах и измерять в своей программе время выполнения запроса.

Вот результаты:

	SQLite	PostgreSQL
Первая запись	`< 1 ms`	`322 ms`
Средняя запись	`460 ms`	`328 ms`
Последняя запись	`880 ms`	`306 ms`

Данные значения получены с первого запуска и последующие запуски дают примерно такие цифры. Никаких средних я не находил.

Собственно выводы: получается, что в SQLite выборка похожа на поиск с линейной сложностью, т.е. перебор всех значений, тогда как в PostgreSQL похоже есть хэширование значений, раз уж время выполнения выборки единичных значений примерно постоянная и не зависит от количества записей (если я правильно понимаю). И таким образом просадки по производительности при росте базы SQLite все же будут.

rumgot ★★★★★
(02.09.21 17:28:50 MSK)
Последнее исправление: rumgot 02.09.21 17:33:31 MSK (всего исправлений: 5)

Ответ на: комментарий от Legioner 01.09.21 14:03:29 MSK

в SQLite ограничение в 2 ГБ на один блоб. При хранении видео можно в него упереться

Мемуары планируешь издавать?

t184256 ★★★★★
(02.09.21 17:32:58 MSK)

Ссылка

Ответ на: комментарий от rumgot 01.09.21 11:59:07 MSK

Если да и последует разрастание базы до десятков а то и сотен мегабайт, то лучше возьми тот же PosgreSQL/MySQL/MongoDB или еще что-нибудь, потому что получишь проблемы в виде тормозов при большом размере базы Sqlite

Пхах. При «разростании до сотен мегабайт» можно хранить данные в текстовом файле и при запуске загружать их целиком в память.

byko3y ★★★★
(02.09.21 18:17:04 MSK)

Ответ на: комментарий от rumgot 02.09.21 17:28:50 MSK

Интересное исследование, спасибо.

EXL ★★★★★
(02.09.21 18:24:18 MSK)

Ссылка

Ответ на: комментарий от byko3y 02.09.21 18:17:04 MSK

При «разростании до сотен мегабайт» можно хранить данные в текстовом файле и при запуске загружать их целиком в память.

В нашем мире текстовые редакторы адекватно не могут в текстовые файлы > 5 МБ, а ты про такое.

EXL ★★★★★
(02.09.21 18:26:26 MSK)

Ответ на: комментарий от Legioner 01.09.21 14:01:17 MSK

Единственная причина, по которой SQLite может быть хуже, это параллельная работа на запись множества транзакций в одной таблице. Там версионная БД вроде постгреса будет выигрывать

Извольте не согласиться. BDB прекрасно вытягивает множество параллельных записей в разные строки таблицы. Многоверсионные СУБД созданы совсем не для решения этой проблемы — они решают только проблему одновременного чтения и записи, или даже скорее так: проблему длительных сложных чтений с требованиями к целостности на фоне безостановочных записей. Если чтения короткие и записи короткие, то MVCC не нужно.

К слову, один из таких сценариев «долгого чтения во время записей» — это таки обсуждаемый бэкап, хоронящий содержимое базы в прошлом.

byko3y ★★★★
(02.09.21 20:39:16 MSK)

Ссылка

Ответ на: комментарий от EXL 02.09.21 18:26:26 MSK

В нашем мире текстовые редакторы адекватно не могут в текстовые файлы > 5 МБ, а ты про такое

Проблема текстовых редакторов заключается во-первых в индексировании переносов строк, а во-вторых в определении высоты строки после переносов. Особенно если текст не моноширинный. А поскольку в тексте еще и может быть юникод, то длину строки нельзя посчитать просто по количеству символов. Отдельные редакторы делают ситуацию сильно хуже, применяя UTF-8 — это худший формат для внутреннего представления. Потом сидят жонглируют байтиками поочередно.

Если же на секунду забыть про все эти не относящиеся к обсуждаемой теме вопросы, то обрабатывать 1 Гб текстового файла в секунду — это вполне нормальная скорость для современного компьютера.

byko3y ★★★★
(02.09.21 20:57:46 MSK)

Ссылка

Ответ на: комментарий от rumgot 02.09.21 17:28:50 MSK

Собственно выводы: получается, что в SQLite выборка похожа на поиск с линейной сложностью, т.е. перебор всех значений, тогда как в PostgreSQL похоже есть хэширование значений, раз уж время выполнения выборки единичных значений примерно постоянная и не зависит от количества записей (если я правильно понимаю). И таким образом просадки по производительности при росте базы SQLite все же будут

Прикольный бенч, но, к сожалению, все эти проблемы SQLite решаются ручным checkpoint-ом, желательно с закрытием старых читающих курсоров. Либо отключением WAL.

Ну и я бы заметил, что все-таки масштаб не тот, особенно учитывая SSD (очень маленький). Скорее всего большую часть времени постгрес здесь занимается не относящимися к обработке данных занятиями, вроде парсинга SQL или ввода-вывода в сокет.

byko3y ★★★★
(02.09.21 21:09:01 MSK)
Последнее исправление: byko3y 02.09.21 21:09:35 MSK (всего исправлений: 1)

Ссылка

В общем, сделал пока через sqlite3 backup api. Только БД, в которую делается бекап, пришлось открывать через функции sqlite3, поскольку при использовании Qt-шного объекта оно падало на sqlite3_backup_init.

В поставку Qt входят исходники sqlite3, так что я просто собрал из них статическую библиотеку, с которой и линкую проект.

s3rjke ★
(16.09.21 10:38:37 MSK) автор топика