LINUX.ORG.RU

Размеры дампов MySQL и PostgreSQL

 , , , ,


0

2

Я уже лет 10 использую self-hosted RSS-агрегатор Tiny Tiny RSS. Все это время использовалась база данных MySQL, которая все эти 10 лет потихоньку увеличивалась и в итоге выросла до 111 МБ (в сжатом виде с помощью gzip).
В последнее время у этого проекта кое-что изменилось, у них теперь установка по умолчанию с помощью docker, MySQL поменяли на PostgreSQL, а прежнюю объявили deprecated. Ну я и решил мигрировать на новую установку с конвертированием MySQL в PostgreSQL с помощью их специально написанного скрипта для обеспечения миграции. Миграция прошла успешно, никакие данные не побились. Но я заметил, что бэкап базы PostgreSQL вырос почти в 2 раза, до 213 МБ в сжатом виде. В несжатом она вообще 665 МБ занимает. Это нормально вообще, что размер базы данных PostgreSQL намного больше, чем в MySQL?

★★★★★

Возможно.

А как бекапы делаешь? А ты уверен, что сама база после конвертации не стала больше? Может они там заодно переделали структуру БД, надобавляли индексов и пр.

hippi90 ★★★★★ ()

Бэкап PostgreSQL (тот который делается с помощью pg_dump) — это просто текстовый SQL-файл. Если MySQL что-то схожее, то увеличение в два раза означает дублирование информации по какой-то причине.

Или имеется в виду, что просто сами файлы которые лежат в директории базы сжимаются? Ну дык, а что ты хотел? Какие-нибудь индексы для полнотекстового поиска могут весьма не хило весить и жмутся они плохо.

Evgueni ★★★★★ ()

Я думаю, что ты сравниваешь несравнимое. Скорей всего в PostgreSQL другой формат базы, другие индексы и тд. Ты xz жмёшь?

Legioner ★★★★★ ()
Ответ на: комментарий от Rinaldus

Попробуй проверь со встроенным сжатием с помощью опции -Fc.

gruy ★★★★★ ()

Подцепись к своей PostgreSQL базе каким-нибудь GUI просмотрщиком да и посмотри.

bhfq ★★★★★ ()

у них теперь установка по умолчанию с помощью docker, MySQL поменяли на PostgreSQL, а прежнюю объявили deprecated.

Теперь нельзя просто распаковать архив и прописать базу-логин-пароль в конфиг? o_0

Radjah ★★★★★ ()
Ответ на: комментарий от cobold

Кто ж их внутренние механизмы знает? Весом можно и пожертвовать в угоду производительности или безотказности

tiinn ★★★★ ()
Последнее исправление: tiinn (всего исправлений: 1)
Ответ на: комментарий от tiinn

Так это же не хайлоад проект, а персональный агрегатор rss. Вообще загадка зачем было связываться с этой миграцией

cobold ★★★ ()
Ответ на: комментарий от cobold

Так это же не хайлоад проект, а персональный агрегатор rss. Вообще загадка зачем было связываться с этой миграцией

Ага, будут разработчики postgresql разбираться, хайлоад у вас проект, или так. Они решили, что их цель - производительность, и СУБД сориентировали на неё.

tiinn ★★★★ ()
Ответ на: комментарий от cobold

Вообще загадка зачем было связываться с этой миграцией

А зачем разработчики сменили базу данных, а старую объявили устаревшей?

fernandos ★★ ()
Ответ на: комментарий от urxvt

А что там можно увидеть, если каждый файл весит несколько сотен мегабайт? Ну увижу в обеих файлах SQL-запросы, они мне могут что-нибудь подсказать?

Rinaldus ★★★★★ ()
Ответ на: комментарий от Rinaldus

Так ты проверил дамп с форматом custom? Есть разница с простым форматом и сжатием?

gruy ★★★★★ ()
Ответ на: комментарий от Rinaldus

Ну там они могу разные запросы генерить. От банального INSERT для каждой строки отдельно и до всяких COPY. Должно быть видно в чем именно разница.
Еще там коменты всякие добавляются.

urxvt ★★★★★ ()
Ограничение на отправку комментариев: только для зарегистрированных пользователей