Когда базы данных нужны, а когда нет?

0

2

Пытаюсь разобраться, в каких случаях БД нужны в десктопных приложениях, а в каких нет. Поможете подобрать use cases?

Конкретно интересует следующее (но не только). Нужно как-нибудь организовать данные в оболочке для словарей. А именно, организовать информацию о словарных статьях (источник, URL, заголовок, код в HTML, plain text и пр.) и об элементах статьи (тип, plain text, позиция и пр.). Хранить можно все в памяти (на данный момент). Элементы статьи должны быть привязаны к конкретной статье.

На данный момент все написано на Python 3, информация о статьях хранится в sqlite3, а элементы статьи реализованы классами. Хочется унифицировать.

Что нравится в БД - это мощь select, делается быстро и не нужно писать дополнительный код, понятная организация данных и контроль БД. Что не нравится - нужно вычислять все за раз и обновлять в транзакциях, иначе будут просадки по скорости.

Ссылка

← Как вывести в файл чтобы интерактивно смотреть

GreenParrot - Qt Creator code color scheme →

Когда есть нужда хранить какие-то данные, которые удобно представлять в табличном виде или когда данных много (хотя тут могут быть варианты, всё зависит от типа данных).

peregrine ★★★★★
(10.05.17 17:51:02 MSK)

Какие ещё просадки скорости в оболочке для словарей?
Давай юскейсы и методики измерения, а то это разговор ни о чём

zolden ★★★★★
(10.05.17 18:21:06 MSK)

А готовой библиотеки с поддержкой какого-нибудь стандарта словарных баз у питона нет?

thesis ★★★★★
(10.05.17 18:39:37 MSK)

Ответ на: комментарий от peregrine 10.05.17 17:51:02 MSK

в табличном виде или когда данных много

Да, это мой случай.

Deleted
(10.05.17 18:41:06 MSK)

Ссылка

Ответ на: комментарий от zolden 10.05.17 18:21:06 MSK

Некоторые вещи, например, html-код статьи, позиция элементов и пр. могут меняться. Серии команд update (если их сотни) работают в sqlite очень медленно (иногда часами), если предварительно не засунуть их в транзакцию, но для этого нужно иметь все результаты на руках, что не всегда удобно из-за текущей организации кода. Я, конечно, могу делать все неправильно.

Deleted
(10.05.17 18:47:50 MSK)

Ответ на: комментарий от thesis 10.05.17 18:39:37 MSK

Есть модули для парсинга разных форматов словарей. Конкретно сейчас моя программа парсит html-код на multitran.ru, и внешние словари пока не подключаются. В отличие от StarDict, GoldenDict и пр., есть возможность работать с отдельными элементами статьи более глубоко (выделять/копировать/удалять/переводить одной кнопкой), в дальнейшем можно будет сортировать/игнорировать элементы, поэтому БД должна включать больше информации, чем может изначально предоставить словарь.

Deleted
(10.05.17 18:55:47 MSK)

Ссылка

Ответ на: комментарий от thesis 10.05.17 18:39:37 MSK

Словарь - частный случай БД ключ-значение.

peregrine ★★★★★
(10.05.17 19:14:16 MSK)

Ссылка

Unkle Bob имеет рассказ, как они замечательно трудились над wiki движком вообще без базы данных. всё прекрасно работало и без неё. но потом пришли заказчики или инвесторы и сказали, что не нужна нам ваша вики, если в ней нет mysql. у нас в корпорации так принято, надо mysql и всё тут.
мораль расплывчата, наверное, но если работает без БД, зачем БД?
а если тебе нужен ACID, то как без БД?
тебе нужен ACID?

system-root ★★★★★
(10.05.17 19:23:25 MSK)

Ответ на: комментарий от system-root 10.05.17 19:23:25 MSK

Нет, ACID мне не нужен, мне нужна более-менее четкая структурированность данных. OK, если без БД, то в каком виде, если будет нужно, сохранять данные на диск? Есть pickle, но он пишет все сразу и не загрузится, если из кода удалить класс, создающий pickle.

Deleted
(10.05.17 19:41:12 MSK)

Ответ на: комментарий от Deleted 10.05.17 19:41:12 MSK

не готов тебе прям сходу начать придумывать методы хранения в файлах для твоей задачи. там всякое можно напридумывать.
скажем «четкая структурированность данных» имеет яркую ассоциацию с XML
ещё я не понял, зачем хранить HTML? это не данные вовсе и у всех одинаковые.

system-root ★★★★★
(10.05.17 21:58:32 MSK)

Ответ на: комментарий от system-root 10.05.17 21:58:32 MSK

зачем хранить HTML?

В данный момент программа принимает на входе html, автосгенерированный авторами Мультитрана и обвешанный лапшой на JavaScript. Он подчищается, структурируется в виде таблицы и создается новый html, который и выводится на экран. html-код хранится для тех случаев, когда пользователь через историю перейдет на уже обработанную словарную статью, чтобы не проводить повторный анализ .

Deleted
(11.05.17 02:48:29 MSK)

Ответ на: комментарий от Deleted 11.05.17 02:48:29 MSK

Это всё хорошо, но не нарушаешь ли ты пользовательские условия сайта мультитрана? Если это так, то не имеет смысла заморачиваться с программой, рано или поздно всё это перестанет работать по техническим или юридическим причинам.

unC0Rr ★★★★★
(11.05.17 08:33:51 MSK)

http://www.pytables.org

zolden ★★★★★
(11.05.17 09:10:51 MSK)

Ответ на: комментарий от Deleted 10.05.17 18:47:50 MSK

update не нужны, делай insert + время, на которую запись актуальна

anonymous
(11.05.17 10:30:06 MSK)

Ссылка

Ответ на: комментарий от zolden 11.05.17 09:10:51 MSK

Интересная штука, посмотрю. Спасибо.

Deleted
(11.05.17 13:09:11 MSK)

Ссылка

Ответ на: комментарий от unC0Rr 11.05.17 08:33:51 MSK

Во-первых, их «пользовательские условия» нигде не прописаны. Во-вторых, в чем состоит нарушение? Я получаю ровно то же, что и пользователь браузера. Помнится, рекламщики хотели засудить AdBlock, но здравый смысл восторжествовал.

Deleted
(11.05.17 13:13:22 MSK)

Ссылка

Нужны, когда данных много, либо когда нужны разнообразные критерии поиска.

Если в твоей базе будет 200 записей, городить БД смысла нет, можно всё хранить в XML. А вот когда записей несколько тысяч - БД однозначно лучше, пусть даже SQLite.

Меня вот печалит, что все программы учёта личных финансов в Linux сделаны на файлах, хотя там как раз явно напрашивается БД, хотя бы из соображений быстродействия. (Последний KMyMoney, правда, умеет в БД, но если я не ошибаюсь, там это лишь один из способов хранения, прикрученный сбоку и проблему быстродействия не решающий.)

hobbit ★★★★★
(11.05.17 20:34:29 MSK)