как легко работать с базой?

orm, python, sqlite, архитектура, базы данных

Я делаю проект в области web scraping, скрипт работает в режиме пула, каждый воркер (или хз как правильно называется, поток/процесс) получает свой объект для работы, в котором содержится URL сайта и прочая информация.

Затем это всё дело работает, по ходу работы раздувает объект нужными мне данными, и я после получения результатов (объекта который уже наполнен данными) уже отправляю SQL запрос для каждого объекта в локальную базу sqlite, туда пишутся некоторые данные объекта которые мне интересны.

Мне вот что не нравится. Если я хочу какое-то новое свойство добавить в объекте, то мне приходится менять структуру таблицы и менять руками SQL запрос, тестить всё это дело потом. Очень накладно выглядит.

Может оно как-то всё можно более красиво делать? И при этом не иметь overhead'а. Я слышал модные слова вроде ORM, и ещё что-то такое, и хочу понять насколько это применимо для меня и что тут вообще можно придумать.

Раньше я не парился и тупо писал всё в файлы, было очень удобно но потом стало файлов нехватать, теперь пытаюсь красиво перелезть в базу (локальную sqlite).

Ссылка

← Словарь алгоритмов и структур данных от NIST

Unittest for snprintf etc →

Так используй алхимию, она вроде обновляет таблицы при обновлении модели

anonymous
(21.10.16 12:13:16 MSK)

Ссылка

SqlAlchemy + Alembic.

i_gnatenko_brain ★★★★
(21.10.16 12:14:01 MSK)

Ссылка

Спасибо ребят! Буду изучать эти технологии, пока что правда не могу сходу понять для чего Alembic используется

rubro
(21.10.16 12:19:12 MSK) автор топика

Ответ на: комментарий от rubro 21.10.16 12:19:12 MSK

Для миграции БД (от одной схемы к другой, в т.ч. и в обратную сторону). В джанго это есть искаропки.

i_gnatenko_brain ★★★★
(21.10.16 12:22:42 MSK)

Ответ на: комментарий от i_gnatenko_brain 21.10.16 12:22:42 MSK

Спасибо, очень занятно!

rubro
(21.10.16 12:25:01 MSK) автор топика

Ссылка

Народ скажите, а вот если меня интересуют связи вида many-to-many, в алхимии с этим всё в порядке будет?

rubro
(21.10.16 12:26:11 MSK) автор топика

Ответ на: комментарий от rubro 21.10.16 12:26:11 MSK

Да, как и в почти любой orm.

pawnhearts ★★★★★
(21.10.16 13:02:54 MSK)

Ссылка

... отправляю SQL запрос для каждого объекта в локальную базу sqlite

sqlite

really?

bvn13 ★★★★★
(21.10.16 14:44:19 MSK)

Ссылка

Тебе проще всего хранить в таблицах pandas и периодически их синхронизировать с sql встроенным механизмом pandas. Pandas - это такой Excel командной строки на стероидах, умеет кучу табличных форматов.

Shadow ★★★★★
(21.10.16 17:42:24 MSK)

Ссылка

Если нужно именно rdbm, есть peewee - сильно быстрее и человечек алхимии, many to many есть.

Shadow ★★★★★
(21.10.16 17:43:45 MSK)

Ссылка

@pawnhearts, спасибо!

@bvn13, что не так?

@Shadow, ок спасибо! От pandas пока что откажусь ввиду overhead'а, буду иметь ввиду что так вообще делают. По peewee нагуглил вот такие минусы: 1. Does not support automatic schema migrations 2. Many-to-Many queries are not intuitive to write

Народ подскажите, мне говорят предубеждения что sqlalchemy это стандарт и более популярно чем остальное, и поэтому начинать стоит именно с неё чтобы понять принципы, и далее уже с неё по необходимости уходить на другие решения. Такая позиция верная? Я начинающий и мне пока что долго всё даётся.

rubro
(22.10.16 12:48:48 MSK) автор топика