UPSERT и не только. Что ждать от PostgreSQL 9.5?

postgresql

5

6

2 июля вышла PostgreSQL 9.5 alpha. Среди основных улучшений можно отметить:

BRIN-индексы («индексы блоковых зон»), позволяющие сверхкомпактно индексировать очень большие таблицы.
Существенные оптимизации скорости сортировки и хэширования в памяти.
Автоматизированное управление размером лога транзакций.
INSERT ... ON CONFLICT UPDATE, также известный как «UPSERT».
Аналитические функции CUBE и ROLLUP.
Безопасность строкового уровня (Row-Level Security, RLS).
Новые манипуляционные возможности (функции и операторы) для типа данных JSONB.
Инструмент pg_rewind и другие улучшения репликации и средств повышения отказоустойчивости.
Множественные улучшения в механизм Foreign Data Wrappers, включая IMPORT FOREIGN SCHEMA.
Существенные улучшения масштабирования на системах с большим количеством процессорных ядер и оперативной памяти.

Статья «UPSERT и не только. Что ждать от PostgreSQL 9.5?» расскажет о некоторых новинках подробнее.

Скачиваем

What's New (англ.)

>>> Подробности

Ссылка

← Qt 5.5

Состоялась конференция LVEE 2015 →

← 1 2 3 4 5 →

Ответ на: комментарий от d9d9 08.07.15 00:33:49 MSK

надо тыкать в pgsql и декартовы прозведения с теориями множеств

anonymous
(08.07.15 01:36:41 MSK)

Ссылка

Ответ на: комментарий от anonymous 08.07.15 01:11:14 MSK

Думаю многие потыкавшись в баги pgadmin забивают на эту базу данных даже не добравшись толком до неё.

Чёрт! Через 7 лет использования постгреса я узнал, что кроме psql бывает ещё и вебморда! Собсна, нафига она была бы мне нужна...

Держись за кресло покрепче. pgadmin - это _не_ вебморда!

anonymous
(08.07.15 01:55:14 MSK)

Ответ на: комментарий от anonymous 08.07.15 01:55:14 MSK

Держись за кресло покрепче. pgadmin - это _не_ вебморда!

всё равно не понимаю зачем мне что то кроме psql, превосходнейший клиент! учитывая, что закалялся я в sql*plus...

anonymous
(08.07.15 02:15:38 MSK)

Ссылка

Ответ на: комментарий от anonymous 08.07.15 01:33:48 MSK

но автотюнинг актуален все-же

согласен. было бы неплохо.

anonymous
(08.07.15 02:17:24 MSK)

Ссылка

Ответ на: комментарий от anonymous 08.07.15 01:11:14 MSK

кроме psql бывает ещё и вебморда!

Какая еще к лешему веб-морда. Я про приложение pgadmin. Что-то в стиле «sql server management studio». psql это надо быть слишком задротом и не ценить свое время.

d9d9 ★★★★
(08.07.15 02:39:55 MSK)

Ответ на: комментарий от anonymous 08.07.15 01:19:51 MSK

Естественно пробовал. Более чем рабочая схема, особенно когда нужны поиски по множеству атрибутов, которые заранее неизвестны.

~~no-dashi~~ ★★★★★
(08.07.15 06:16:47 MSK)

Ответ на: комментарий от anonymous 08.07.15 01:17:39 MSK

ФС можно рассматривать как некоторую СУБД, спору нет.

ФС можно рассматривать как «движок» хранения данных, а не СУБД. ОС можно рассматривать как СУБД.

при чём тут постгрес?

Постгрес - это частный случай ОС :-)

anonymous
(08.07.15 08:41:43 MSK)

Ответ на: комментарий от d9d9 08.07.15 00:33:49 MSK

У постгреса есть большая проблема на мой взгляд - бесплатные средства для работы с ней еще та галиматья.

А что, если купить качественный инструмент?

anonymous
(08.07.15 08:44:22 MSK)

Ответ на: комментарий от no-dashi 08.07.15 06:16:47 MSK

Более чем рабочая схема, особенно когда нужны поиски по множеству атрибутов, которые заранее неизвестны.

А когда такие поиски не нужны, а нужен поиск по конкретным атрибутам с типами, отличными от строкового? Тут все «достоинства» и вылазят: и просадка производительности, и многоэтажные запросы, и проблемы с оптимизацией этих запросов.

И почему EAV более «реляционна» чем создание таблицы или хранение структурированного blob? С blob понятно, они находятся примерно в одной категории, можно поспорить, кто «реляционее». Но с обычной таблицей?..

amm ★★
(08.07.15 08:52:32 MSK)

Ссылка

Ответ на: комментарий от RedPossum 07.07.15 23:16:15 MSK

Это с одной стороны, а с другой, у тебя даже 1нф не выполняется.

Как это — не выполняется? Еще как выполняется! Блоб с точки зрения РБД — атомарен. Я даже спорить по данному вопросу не собираюсь ввиду бесперспективности, т.к. мы просто упрёмся в аналог дисциплины спецолимпиады как моделировать ФИО:«Иванов Иван Иванович» или («Иванов», «Иван», «Иванович») или («Иванов», «Иван Иванович»).

При 1НФ нормализации нужно знать когда необходимо остановиться, а то можно донормализоваться до разборки строк на кодпойнты, кодпойнтов — на байты, а байт — на биты.

Кстати, решение «динамическая таблица на сигнал» — вообще антиидиома. Как и таблица «атрибуты документов». Но да, применяется широко.

Macil ★★★★★
(08.07.15 09:50:41 MSK)

Ссылка

Ответ на: комментарий от d9d9 08.07.15 00:33:49 MSK

А зачем нужен pgadmin, если есть psql?

Из GUI мне лично очень понравился плагин Database из IntelliJ IDEA (есть в виде отдельного продукта 0xdbe).

~~Legioner~~ ★★★★★
(08.07.15 12:22:01 MSK)

Ссылка

Ответ на: комментарий от no-dashi 08.07.15 06:16:47 MSK

Естественно пробовал

т.е. объёмы были смешные и производительность не волновала. да, так это будет вполне работать.

anonymous
(08.07.15 12:25:29 MSK)

Ссылка

Ответ на: комментарий от d9d9 08.07.15 02:39:55 MSK

Что задротского в psql? Ладно, секретарши не осилили SQL, для которых он создавался, но сегодня уже что, программисты, работающие с БД, не осиливают SQL?

Чего конкретно не хватает в psql? Я могу представить себе только автодополнение имён таблиц и столбцов. Но во всяких mysqladmin этого тоже нет. Там такое же текстовое окошко для ввода SQL.

~~Legioner~~ ★★★★★
(08.07.15 12:26:04 MSK)

Ответ на: комментарий от d9d9 08.07.15 02:39:55 MSK

psql это надо быть слишком задротом

ПНХ. я ценю своё время, у меня всё получается в psql.

anonymous
(08.07.15 12:28:56 MSK)

Ссылка

Ответ на: комментарий от anonymous 08.07.15 08:44:22 MSK

кстати toad для слона не помешал бы

anonymous
(08.07.15 12:30:31 MSK)

Ссылка

Ответ на: комментарий от anonymous 08.07.15 08:41:43 MSK

ФС можно рассматривать как «движок» хранения данных, а не СУБД. ОС можно рассматривать как СУБД.

Всё можно рассматривать движком хранения данных. a[0] = «блабла» — тоже движок хранения данных. А вот что такое ОС стоит всё-таки ознакмиться с формальными определениями, а не выдумывать самостоятельно.

P.S. и чего блин капча злая сегодня? уйду нафиг отсюда.

anonymous
(08.07.15 12:33:51 MSK)

Redis и MongoDB не нужны, потому что Постгрес проще, удобнее и быстрее. Если бы Ruby был написан на хранимках в Постгресе, он работал бы в три раза быстрее и не падал. Ноду пришлось писать на V8, потому что джаваскриптеры не поняли лицензию Постгреса, а Erlang появился, потому что кто-то просто не умеет пользоваться триггерами и хранимками. K&R после создания C пришлось писать UNIX, потому что они хотели, конечно, написать Постгрес, но ему было не на чем запускаться. C++0X появился только для того, чтобы умные люди перестали писать на C и перешли на Постгрес. Разработка файловых систем нового поколения часто тормозится (особенно ZFS), потому что люди понимают, что с какой стороны не подходи и что не делай, а из-за требований нормальной транзакционности все равно получается Постгрес! Сам Постгрес написан на хранимках Постгреса, мейкфайл выполнен в виде дампа Постгреса, и собирается Постгрес Постгресом.

anonymous
(08.07.15 12:36:00 MSK)

Ответ на: комментарий от Legioner 08.07.15 12:26:04 MSK

Что задротского в psql?

И действительно, что задротского в лысой командной строке. Даже не знаю что сказать... Ну наверно всё!

Обычно открыто стопицот миллионов редактируемых sql запросов/процедур, между которыми надо быстро переключаться, интерфейс каждой из которых должен выводить код на весь экран с подсветкой синтакиса с возможностью моментально эти запросы выполнять комбинацией кнопок. Приблизительно так выглядит ежедневная работа с sql напрямую. А тыкаться в командную строку где все однозадачное, чернобелое и в одну линию - это даже не смешно.

d9d9 ★★★★
(08.07.15 13:30:33 MSK)

Ответ на: комментарий от anonymous 08.07.15 12:36:00 MSK

Постргрес не нужнен, потому что есть Постгрес. :-)

anonymous
(08.07.15 13:37:45 MSK)

Ссылка

Ответ на: комментарий от anonymous 08.07.15 12:36:00 MSK

C++0X появился только для того, чтобы умные люди перестали писать на C и перешли на Постгрес.

Цепепе-ноль-икс - это такой мощный язык, что Постгрес не нужен :-)

anonymous
(08.07.15 13:41:10 MSK)

Ссылка

Ответ на: комментарий от d9d9 08.07.15 13:30:33 MSK

И действительно, что задротского в лысой командной строке. Даже не знаю что сказать... Ну наверно всё!

Боюсь тебя огорчить, но лысой командной строкой пользуются миллионы администраторов и разработчиков по всему миру. И весьма довольны ей.

Обычно открыто стопицот миллионов редактируемых sql запросов/процедур, между которыми надо быстро переключаться, интерфейс каждой из которых должен выводить код на весь экран с подсветкой синтакиса с возможностью моментально эти запросы выполнять комбинацией кнопок. Приблизительно так выглядит ежедневная работа с sql напрямую. А тыкаться в командную строку где все однозадачное, чернобелое и в одну линию - это даже не смешно.

Первое, что я делаю в IDE это отключаю попугайскую расцветку. Потому что отвлекает. И знаю многих, кто делает то же самое. Это так, абстрактно.

Миллионы SQL-запросов прекрасно хранятся в файлах. В psql можно загрузить запрос из файла, можно его передать в vim для редактирования (который тебе подсветит всё, что угодно), уж выполнить запрос-то и подавно можно.

~~Legioner~~ ★★★★★
(08.07.15 14:05:16 MSK)

Ответ на: комментарий от Legioner 08.07.15 12:26:04 MSK

Там есть автодополнение по табу

anonymous
(08.07.15 14:06:42 MSK)

Ссылка

Ответ на: комментарий от Legioner 08.07.15 14:05:16 MSK

Первое, что я делаю в IDE это отключаю попугайскую расцветку. Потому что отвлекает.

Твой аватар попугайский и отвлекает. Отключай.

anonymous
(08.07.15 14:23:45 MSK)

Ссылка

Ответ на: комментарий от Legioner 08.07.15 14:05:16 MSK

лысой командной строкой пользуются миллионы администраторов и разработчиков по всему миру

Так и я пользуюсь в редких случаях для минорных задач. Но это где-то так же эффективно, как пахать лопатой поле. Можно, кто же против. Дело не в возможности. А работать с многостраничным кодом без подсветки, ну... могу только посочувствовать. Причем твоим работодателям в первую очередь.

d9d9 ★★★★
(08.07.15 14:31:48 MSK)

Ссылка

Ответ на: комментарий от Legioner 08.07.15 12:26:04 MSK

Чего конкретно не хватает в psql?

Многострочного редактирования, сейчас если запускать внешний редактор для этого то тогда невозможно вернуться обратно и посмотреть например схему таблицы, если выйти из редактора до окончания написания запроса, то невозможно выполнить какой-то другой запрос так как буфер будет занят недописанным запросом.

Там такое же текстовое окошко для ввода SQL.

Но там не только окошко для запросов, там например список баз. Когда у тебя одна база, это одно, когда их например 15, то это уже другое и хотелось бы видеть какой-то их список, где можно нажать и подключиться.

psql замечательный инструмент, но это только часть, кирпичик из которых ты строишь свою систему разработки сам, как минимум тебе нужен ещё текстовой редактор. Кто-то готов этим заниматься, а кто-то нет и ему проще использовать готовые системы, хотя бы тот же pgadmin

anonymous
(08.07.15 15:52:22 MSK)

Ссылка

Ответ на: комментарий от Legioner 08.07.15 12:26:04 MSK

Синтаксис SQL это для каких-нибудь кобольщиков. Нормальный человек чем реже его видит тем лучше себя чувствует.

anonymous
(08.07.15 17:58:07 MSK)

Ответ на: комментарий от anonymous 08.07.15 17:58:07 MSK

Синтаксис SQL это для каких-нибудь кобольщиков. Нормальный человек чем реже его видит тем лучше себя чувствует.

Нормальному человеку синтаксис вообще до фонаря.

anonymous
(08.07.15 18:01:09 MSK)

Ссылка

Ответ на: комментарий от Legioner 08.07.15 12:26:04 MSK

Но во всяких mysqladmin этого тоже нет.

Есть.

Oxana
(08.07.15 19:14:31 MSK)

Ответ на: комментарий от Oxana 08.07.15 19:14:31 MSK

И даже внутри текстового литерала в функции на plpython?

anonymous
(08.07.15 22:48:27 MSK)

Ответ на: комментарий от anonymous 08.07.15 22:48:27 MSK

Странно ждать дополнения в PL/Python от клтиента MySQL, не находите?

Oxana
(09.07.15 00:36:18 MSK)

Ответ на: комментарий от Oxana 09.07.15 00:36:18 MSK

Странно обсуждать клиент MySQL в теме о postgres, не так ли?

anonymous
(09.07.15 00:43:53 MSK)

Ответ на: комментарий от anonymous 08.07.15 12:36:00 MSK

даже небо, даже аллах!

anonymous
(09.07.15 01:12:02 MSK)

Ссылка

Ответ на: комментарий от anonymous 08.07.15 12:33:51 MSK

да, в общей массе люди разучились читать книги, начитались дилетантских статей, разучились оперировать определениями, могут только на примерах что-то объяснить, и то не из той оперы примеры берут

anonymous
(09.07.15 01:15:26 MSK)

Ссылка

Ответ на: комментарий от anonymous 09.07.15 00:43:53 MSK

И не менее странно задавать вопрос той, кто не начинал это обсуждение ;-)

Oxana
(09.07.15 02:01:41 MSK)

Ответ на: комментарий от Oxana 09.07.15 02:01:41 MSK

Раз не ты начинала, значит участие в обсуждении не считается. Логично.

anonymous
(09.07.15 03:51:56 MSK)

Ссылка

Ответ на: комментарий от erzent 05.07.15 17:52:59 MSK

у 7 нянек, ну, дальше Вы знаете для 1С 4 специалиста. ню-ню

anonymous
(09.07.15 08:45:07 MSK)

Ссылка

Ответ на: комментарий от FilosofeM 04.07.15 12:03:56 MSK

Кроме элиты MSSQL что-то нужно ещё лол?

anonymous
(09.07.15 09:07:28 MSK)

Ссылка

Ответ на: комментарий от PolarFox 07.07.15 14:17:50 MSK

нет. для типовых задач амно-сайтов - мускул на самом деле попроще.

mumpster ★★★★★
(09.07.15 20:42:40 MSK)

Ссылка

Ответ на: комментарий от AnDoR 07.07.15 13:48:27 MSK

Если тебе действительно часто нужно проверять точное количество всех записей в таблице, без условий, то ты почти наверняка что-то делаешь не так.

Мне не нужно «часто проверять», мне нужно показать пользователю (оператору АРМ) обычный CRUD: списки заказов, пользователей, звонков в колл-центр и т.п. Естественно, мне нужно показывать сколько в системе тех же пользователей. Что тут не так-то?

Тормозить оно начинает уже от 100 тысяч записей, апгрейдом железа и покупкой provisioned IOPS на амазоне можно добиться относительно приемлимой работы на 500-800 тысячах, но в любом случае это неприемлемо. Сейчас у меня в проекте сущности, которых уже 40 миллионов, и их опять нужно показывать с поиском, фильтрацией и указанием количества результатов. Поиск и фильтрация по индексам работают идеально, а вот количество результатов считается минутами.

Я, конечно, прикостылил обёртывание запросов в SELECT COUNT(*) FROM ($query LIMIT 10000) и добавил парсер EXPLAIN ANALYZE, но не знаю как без матов прокомментировать такое «решение».

southern_sun
(10.07.15 20:18:25 MSK)

Ответ на: комментарий от southern_sun 10.07.15 20:18:25 MSK

А зачем пользователю знать, сколько миллионов строк в результате? Показать кнопку «дальше» и всё. Как показать кнопку «дальше» и как эффективно найти следующую страничку, думаю, и так понятно.

~~Legioner~~ ★★★★★
(10.07.15 20:32:01 MSK)

Ссылка

Ответ на: комментарий от southern_sun 10.07.15 20:18:25 MSK

Много хотите. Версионник не может хранить количество строк одно на всех, поэтому каждая сессия считает их для себя сама, и результат валиден только условно. Если же считать количество строк в таблице триггером, то одновременные транзакции, приводящие к изменению количества записей в таблице, будут ждать друг друга. Выбирайте, что вам подходит больше. За деталями - в вики. Собственно, блокировочник (типа mssql) считает (считывает из метаданных) быстро, но, в общем случае, тоже неправильно (см. уровни изоляции транзакций). В итоге задача решается подходящим для конкретной задачи способом, поэтому постгрес не дает ответа, но дает инструменты.

parihaaraka
(10.07.15 22:44:01 MSK)

Ссылка

Ответ на: комментарий от post-factum 04.07.15 23:50:37 MSK

MariaDB это то же самое, что и MySQL.

Лол.

назовешь 10 отличий и свободен

anonymous
(11.07.15 06:36:38 MSK)

Ссылка

Ответ на: комментарий от southern_sun 10.07.15 20:18:25 MSK

Тормозить оно начинает уже от 100 тысяч записей

ни одна база данных не способна противостоять идиотам - они всегда побеждали и будут побеждать. аминь...

anonymous
(11.07.15 06:41:00 MSK)

Ссылка

Ответ на: комментарий от southern_sun 10.07.15 20:18:25 MSK

Погоди, у тебя количество пользователей получается запросом select count(*) from tablename;?

AnDoR ★★★★★
(11.07.15 14:07:50 MSK)

Ответ на: комментарий от AnDoR 11.07.15 14:07:50 MSK

а как надо делать в таком случае?

AndreyKl ★★★★★
(11.07.15 14:22:08 MSK)

Ссылка

Ответ на: комментарий от southern_sun 10.07.15 20:18:25 MSK

Я, конечно, прикостылил обёртывание запросов в SELECT COUNT(*) FROM ($query LIMIT 10000) и добавил парсер EXPLAIN ANALYZE, но не знаю как без матов прокомментировать такое «решение».

согласен. я тоже не знаю как без матов это прокомментировать. я думаю, что у тебя таких моментов более одного, судя по подходу. и не важно, постгрес то или нет, но твои решения, я подозреваю, часто без матов трудно комментировать. может быть, стоит начать включать голову, если задача не решается влоб? может быть начнёшь делать решения, которые не требуют матов для комментирования?

anonymous
(11.07.15 16:22:40 MSK)

Ответ на: комментарий от Macil 07.07.15 08:38:25 MSK

есть документ со 100500 полями, который никогда не меняется, а для его визуализации нужна львиная доля данных. Что будет более «реляционно»: создавать кортеж размером 100500 или сделать отдельные поля для индексов, а остальное засунуть в блоб/композитный тип/JSON?

ну, и где тут проблема? проблема у вас в голове. и то и другое решение, равно как и бесконечное множество других решений, находящихся где-то между ними, приемлемы и все сводится к выбору одного из них для решения этой типовой задачи.

anonymous
(12.07.15 03:53:37 MSK)

Ссылка

Ответ на: комментарий от anonymous 11.07.15 16:22:40 MSK

судя по подходу
если задача не решается влоб?

В тебе пропадает бюрократ, всеми силами цепляющийся за необходимость существования запретов там, где требуется простое как гвоздь решение, и считает само собой очевидным, что нужно набрать 10 справок на разных концах города. В лоб же не решается, нужен «подход»!

Не смешно ли, когда для подсчета количества результатов нужно потратить больше человеко-часов, чем для разработки всего проекта?

Если база данных даже не может простым способом посчитать количество хранящихся в себе данных, то такая база данных не нужна. Абсолютно насрать на транзакции. Пусть оно хотя бы в автокоммит режиме быстро работает.

А зачем пользователю знать, сколько миллионов строк в результате?
Показать кнопку «дальше» и всё.

Зачем владельцу системы знать, сколько у него пользователей? Ну я даже не знаю. Может потому, что это основной маркетинговый показатель, на который он надрачивает?

Зачем гугл показывает, сколько страниц находится на какой-то запрос? Да никому это не надо, просто показывай кнопку «дальше» и в ус не дуй. Бессмысленная же информация, правда? Да и общее количество страниц в индексе гугла никому, включая сам гугл, не интересно.

Если мой скрипт неделю рассчитывает йобы и в один поток без транзакций складывает результаты в базу, зачем мне знать, сколько штук он их рассчитал? Никакого интереса. Конечно, гораздо интереснее каждый раз для каждой аналогичной задачи изобретать свой велосипед.

Я поражаюсь вашему желанию оправдывать говно.

southern_sun
(13.07.15 11:20:15 MSK)

Ответ на: комментарий от southern_sun 13.07.15 11:20:15 MSK

бюрократ, всеми силами цепляющийся за необходимость существования запретов

Ну, тут как сказать. Есть такая бюрократия, польза которой очевидна. Но такие случаи относительно редки. Условно скажем, ядерная энергетика. Или в военной сфере. Есть нормативы, нарушение которых приводит к гибели людей. Такие нормы, понятно, будут соблюдаться пунктуально. В современных условиях значительная часть бюрократий легко идёт на нарушение таких норм, которые нарушать нельзя, даже законодательные нормы нарушаются. Выдумывая при этом свои собственные «низ-зя» для оправдания своего существования

Deleted
(13.07.15 12:39:33 MSK)