Как лучше обновлять таблицу в базе?

0

1

Есть тяжелый sql запрос. Нужно его результат сохранять в таблицу и эту таблицу обновлять каждый час. Я каждый раз удалял таблицу и наполнял заново. Бывало даже создавал рядом другую таблицу, наполнял, первую удалял а эту переименовывал. Какое лучше решение использовать чтобы даже при нескольких запусках одновременно скрипта данные не перезатирались и дублей не было?

Ссылка

←	Проблемы с доступом к джой... php.net

Lighttpd как reverse proxy для MeshCentral

→

Я каждый раз удалял таблицу и наполнял заново.

Достаточно удалять все данные: delete from my_table , заново создавать таблицу точно не надо.

Какое лучше решение использовать чтобы даже при нескольких запусках одновременно скрипта данные не перезатирались и дублей не было?

Либо уникальные ключи (например uuid) либо блокировка. Блокировку не обязательно делать на уровне таблицы, можно просто выставлять флажок is_working в отдельную таблицу при запуске и проверять его до начала записи. Если флажок стоит то идет выполнение другой копии.

alex0x08 ★★★
(25.10.23 01:02:15 MSK)

Ответ на: комментарий от alex0x08 25.10.23 01:02:15 MSK

В предложенном виде ни один из вариантов не сработает.

~~HE_KOT~~ ☆
(25.10.23 03:38:39 MSK)

возможно?

скрипт(ы) пусть пишет в хронологическую таблицу(т.е == выходной + поля делающую каждую запись уникальной и упорядоченной в некотором «темпоральном» смысле) + 1 жнец(на стороне хз где) который поедает таблицу от старого к новому перенося(обновляя добавляя удаляя) кортежу в "выходную " таблицу

qulinxao3 ★☆
(25.10.23 06:24:14 MSK)

Ссылка

Есть тяжелый sql запрос

Зная автора (а также глядя на выбор его вариантов), это может означать, как:

действительно, SQL-запрос на получение данных из БД, который и нагружает движок
или же, что процесс подготовки данных для вставки длительный и ресурсоемкий

В любом случае, не надо решать XY, но скорее всего автор не раскроет ни X и ни Y.

vvn_black ★★★★★
(25.10.23 07:36:03 MSK)

Ссылка

Ответ на: комментарий от HE_KOT 25.10.23 03:38:39 MSK

В предложенном виде ни один из вариантов не сработает.

И что же им помешает?

alex0x08 ★★★
(25.10.23 07:42:47 MSK)

Какое лучше решение использовать чтобы даже при нескольких запусках одновременно скрипта данные не перезатирались и дублей не было?

Я так понял этот скрипт по крону раз в час обновляет данные? Зачем его тогда запускать несколько раз одновременно?

goingUp ★★★★★
(25.10.23 08:02:20 MSK)
Последнее исправление: goingUp 25.10.23 08:03:08 MSK (всего исправлений: 1)

Ссылка

Можно создать Materialized view, они сделаны как раз для таких случаев, когда долгий запрос надо регулярно обновлять

Упс, в mysql похоже нет встроенного механизма матвью, но вот тут https://fromdual.com/mysql-materialized-views есть пример процедуры, в транзакции делается truncate и insert, проблем с отсутствием данных или дублями не будет

DROP PROCEDURE refresh_mv_now;

DELIMITER $$

CREATE PROCEDURE refresh_mv_now (
    OUT rc INT
)
BEGIN

  TRUNCATE TABLE sales_mv;

  INSERT INTO sales_mv
  SELECT product_name
      , SUM(product_price), SUM(product_amount)
      , AVG(product_price), AVG(product_amount)
      , COUNT(*)
    FROM sales
  GROUP BY product_name;

  SET rc = 0;
END;
$$

DELIMITER ;

masa ★★★
(25.10.23 09:34:13 MSK)
Последнее исправление: masa 25.10.23 09:41:17 MSK (всего исправлений: 1)

Да, наверное.

ЗЫ ЯННП

~~mrjaggers~~
(25.10.23 10:01:16 MSK)

Ссылка

Ответ на: комментарий от alex0x08 25.10.23 07:42:47 MSK

уникальные ID никак не предотвратят запись дубликатов, а is_working предлагается менять из двух разных транзакций, что просто приведёт к паузе при ожидании блокировки в одной из них.

~~HE_KOT~~ ☆
(25.10.23 11:19:39 MSK)

Ответ на: комментарий от masa 25.10.23 09:34:13 MSK

Не надо давать плохих советов. Между truncate и insert может быть неопределенное время. Надо делать в темптэйбл, после чего атомарно обновлять ddl для вьюхи.

Anoxemian ★★★★★
(25.10.23 11:22:35 MSK)

Ссылка

каждый раз удалял таблицу и наполнял заново

чтобы даже при нескольких запусках одновременно скрипта данные не перезатирались

ЯННП.

no-such-file ★★★★★
(25.10.23 12:46:14 MSK)

Ответ на: комментарий от no-such-file 25.10.23 12:46:14 MSK

он сделал кнопку «посчитать» в вебне, которая запускает получасовую задачу безо всякой индикации выполнения. Девочке-буху надоедает ждать, и она периодически нажимает снова и снова, приближая технологическую сингулярность.

~~HE_KOT~~ ☆
(25.10.23 14:36:12 MSK)

Ответ на: комментарий от HE_KOT 25.10.23 11:19:39 MSK

select for update skip locked поможет в случае is_working, но это выглядит как костыль при наличии advisory locks (или их аналогов в mysql, никогда им не пользовался).

Хотя, зная ТС, соглашусь с vvn_black, что тут скорее всего проблема XY, и задачу можно решить кардинально иначе без приседаний с удалением таблиц (и возможно без блокировок), но мы это уже никогда не узнаем.

theNamelessOne ★★★★★
(25.10.23 15:04:20 MSK)

Ссылка

Ответ на: комментарий от HE_KOT 25.10.23 14:36:12 MSK

Два ведра энтропии сему господину

cocucka_B_TECTE ☆
(25.10.23 15:15:13 MSK)

Ссылка

Ответ на: комментарий от HE_KOT 25.10.23 14:36:12 MSK

Мы всё умрём что ли? Из-за ТСа.

~~mrjaggers~~
(25.10.23 17:32:40 MSK)

Ссылка

добавь поле с датой создания к записям таблицы и делай так что-бы весь заинтересованный код получал данные по самой свежей дате, можно прозрачно с помощью вьюхи субд
сделай отдельный джоб который чистит старые данные с необходимой и достаточной интенсивностью

Syncro ★★★★★
(09.11.23 13:22:42 MSK)
Последнее исправление: Syncro 09.11.23 13:23:19 MSK (всего исправлений: 1)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Проблемы с доступом к джой... php.net

Web-development

Lighttpd как reverse proxy для MeshCentral

→

Похожие темы