Новая версия PostgreSQL - 8.3.0

postgresql, базы данных

4 февраля 2008 года вышла новая версия свободной СУБД PostgreSQL - 8.3.0.

Основные изменения:

* миграция модуля для полнотекстового поиска (contrib/tsearch2) в ядро системы;
* реализация Heap Only Tuples (HOT);
* теперь autovacuum включён по умолчанию;
* возможен запуск сразу нескольких процессов autovacuum;
* заметное уменьшение дискового пространства, занимаемого базами данных;
* выполнение транзакций, не модифицирующих данные, не приводит к увеличению значения счётчика транзакций (xid);
* реализован механизм автонастройки параметров процесса bgwriter;
* оптимизирован механизм получения результата для запросов с использованием « …ORDER BY … LIMIT…» (т. н. Top-N sorting);
* поддержка XML, в том числе новый тип данных - xml;
* автоматическая инвалидация кэша плана запросов для PL/pgSQL-функций;
* конструкции «CREATE FUNCTION … RETURNS TABLE» и «RETURN TABLE…» для создания функций, результатом которых является таблица;
* поддержка операции обновления для курсоров;
* стандартная (ISO/ANSI SQL) конструкция «ORDER BY … NULLS FIRST/LAST» для упрощения установки порядка следования NULL-значений (также помогает при миграции с других СУБД);
* индексация NULL-значений в GiST-индексах.

Подробное описание на русском языке: http://postgresmen.ru/articles/view/78

>>> Скачать

Ссылка

← Может ли KDE спасти умирающую платформу Windows?

GNU GRUB 1.96 →

← 1 2 →

Ответ на: комментарий от anonymous 04.02.08 19:25:17 MSK

>а Datamining не хочешь?

Хочу :)

А вообще, какие есть системы бизнес аналитики на базе сабжа?

anonymous
(05.02.08 10:04:36 MSK)

Ответ на: комментарий от neDBA 04.02.08 20:23:15 MSK

>Если владеешь великим буржуйским языком - то матвъю легко реализовать и руками - поддержка в ядре не особенно то и нужна. Более подробно, для начала, используй как отправную точку: http://www.benjaminarai.com/benjamin_arai/index.php?display=/postgresql_mater.. .

Ну это ж костыли.. Я видел проприетарные реализации, но они вяло поддерживаются. Странно что разработчики не подумали в этом направлении, ведь хороший сегмент, денежный.

anonymous
(05.02.08 10:06:40 MSK)

Ссылка

Ответ на: комментарий от anonymous 05.02.08 10:04:36 MSK

> системы бизнес аналитики

Ололо, оналитик ты наш. Когда же это бизнес-быдло научится пользоваться дефисом?

anonymous
(05.02.08 10:13:27 MSK)

Ответ на: комментарий от anonymous 05.02.08 10:13:27 MSK

>Ололо, оналитик ты наш. Когда же это бизнес-быдло научится пользоваться дефисом?

Дефис есмь перст диавольский, особо рядом с премерзким словом "бизнес". Не нам угодно его использовать, безблагодатно это.

anonymous
(05.02.08 10:43:13 MSK)

Ссылка

Ответ на: комментарий от Deleted 04.02.08 20:51:46 MSK

> Это называется костыль, а не реализация матвью

Прикрутить RULES на INSERT, DELETE, UPDATE к представлению не подходит?

anonymous
(05.02.08 11:47:17 MSK)

Ссылка

А когда сделают чтото на подобие пакетов для процедур. Ну как в oracle. Ато если их там очень много то както невкусно получается. В oracle вкуснее.

Может оно уже есть да я незнаю, подскажите пожалуста

anonymous
(05.02.08 11:47:17 MSK)

Ответ на: комментарий от anonymous 05.02.08 11:47:17 MSK

> А когда сделают чтото на подобие пакетов для процедур.

Дадад, и менеджер пакетов с зависимостями, и debconf туда же портировать, чо там.

anonymous
(05.02.08 11:49:20 MSK)

Ответ на: комментарий от anonymous 05.02.08 11:49:20 MSK

оболдуйство какоето. Ты видно не понимаешь сути.

anonymous
(05.02.08 11:52:54 MSK)

Ссылка

Ответ на: комментарий от emacs 04.02.08 14:59:52 MSK

>>> * миграция модуля для полнотекстового поиска (contrib/tsearch2) в ядро системы;

> Отлично!

> А как его сделать case-insensitive для русского в utf-8 кто-нибудь может сказать?

Ты бы лучше рассказал, как его сделать case-sensitive :)

Если локаль базы настроена - то поиск case-insensitive.

teodor ★
(05.02.08 12:46:32 MSK)

Ссылка

Ответ на: комментарий от anonymous 04.02.08 18:49:51 MSK

> кроме того, что мешает вместо tsearch2 ... использовать любой xapian или sphinx? латентная любовь к "интегрированным системам"?

ACID

teodor ★
(05.02.08 12:47:07 MSK)

Ссылка

Автар уверенно лажает:

> * индексация NULL-значений в GiST-индексах.

Перевод: постгрес теперь может использовать Btree и GiST индексы в запросах типа column is NULL.

teodor ★
(05.02.08 12:49:46 MSK)

Ссылка

В дереве портов FreeBSD ports/databases/postgresql83-server/ уже есть.

iZEN ★★★★★
(05.02.08 15:48:12 MSK)

Ответ на: комментарий от iZEN 05.02.08 15:48:12 MSK

> В дереве портов FreeBSD ports/databases/postgresql83-server/ уже есть.

Да кому нафиг эта фря сдалась.. Да и все равно никто не будет на ней сервер БД делать.

anonymous
(05.02.08 16:57:44 MSK)

Ответ на: комментарий от anonymous 04.02.08 19:33:27 MSK

> sphinx - говноподелие, имеющее к настоящему полнотекстовому поиску отношение не более чем hello_world.с к ядру Linux.

можно с этого места поподробней? почему sphinx говноподелие и почему он так плох для полнотекстового поиска? кстати а чем так хорош xapian ? по официальному списку фич я не увидел значительных преимуществ.

Vark ★
(05.02.08 17:05:04 MSK)

Ответ на: комментарий от Vark 05.02.08 17:05:04 MSK

>можно с этого места поподробней? почему sphinx говноподелие и почему он так плох для полнотекстового поиска? кстати а чем так хорош xapian ? по официальному списку фич я не увидел значительных преимуществ.

Не xapian, а lucene. Плох - алгоритмом вычисления релевантности документа (хинт: искать быстро - не значит "искать правильно").

Чем так хорош xapinan, который рекламировал другой анонимус, я не знаю.

anonymous
(05.02.08 18:38:53 MSK)

Ответ на: комментарий от anonymous 05.02.08 16:57:44 MSK

>> В дереве портов FreeBSD ports/databases/postgresql83-server/ уже есть.

>Да кому нафиг эта фря сдалась.. Да и все равно никто не будет на ней сервер БД делать.

За себя говори, тупое быдло. Большая чать РУнета живет на FreeBSD.

anonymous
(05.02.08 18:39:47 MSK)

Ссылка

Ответ на: комментарий от anonymous 05.02.08 18:38:53 MSK

> Не xapian, а lucene. Плох - алгоритмом вычисления релевантности документа (хинт: искать быстро - не значит "искать правильно").

Это единственный его минус? А если алгоритм вычисления релевантности заменить на свой, который будет устраивать, то тогда это уже не говноподелие? Опенсорс все-таки. Про lucene я знаю, но так и не попробовал в деле.

Vark ★
(05.02.08 19:45:02 MSK)

Ответ на: комментарий от anonymous 05.02.08 16:57:44 MSK

>> В дереве портов FreeBSD ports/databases/postgresql83-server/ уже есть.

>Да кому нафиг эта фря сдалась.. Да и все равно никто не будет на ней сервер БД делать.

Дурень - постгре на фре уделывает всех!
И только придуки типа тебя угюмо кликают в PostgreSQL_installer.msi :)

anonymous
(05.02.08 20:57:59 MSK)

Ссылка

Хорошая база данных, только документации на русском увы под нее практически нет.

anonymous
(05.02.08 22:48:37 MSK)

Ссылка

вопрос знатокам. на мускуле кажется принципиально не возможно сделать больше 1к нитей. Если постгрес создаёт нить на каждого клиента - это ведь тоже - не масштабируемо при диком количестве клиентов (хинт: а как же async IO, epolls со-товарищи?) Как у них дела со scaling-up? 10k+, типа.

как оптимайзер - такой-же "вумный" как в дб2? (хинты там тоже есть/полезны?)

Anode

anonymous
(06.02.08 08:53:39 MSK)

Ответ на: комментарий от anonymous 06.02.08 08:53:39 MSK

> Если постгрес создаёт нить на каждого клиента - это ведь тоже - не масштабируемо при диком количестве клиентов (хинт: а как же async IO, polls со-товарищи?) Как у них дела со scaling-up? 10k+, типа.

Постгрес на каждый коннект форкает процесс (в его терминологии - backend), поэтому большое число коннектов для постгреса - это очень плохо. И надо использовать постоянные коннекты, поскольку fork() - это не быстро.

Используйте pgbouncer - он умеет мультиплексировать коннекции постгреса и коннект к нему намного быстрее. Т.е. это процесс, который снаружи пахнет и выглядит как постгрес и отображает N клиентов на M backend'ов.

> как оптимайзер - такой-же "вумный" как в дб2? (хинты там тоже есть/полезны?)

Оптимайзер вполне умный, со своими твиками. Нерешаемых проблем не встречал, в крайнем случае пожалуйтесь разработчикам, вам помогут. Хинтов нет принципиально - считается, что если оптимайзер нуждается в хинте, значит, на самом деле, он нуждается в исправлении.

teodor ★
(06.02.08 10:32:49 MSK)

Ответ на: комментарий от Vark 05.02.08 19:45:02 MSK

>Это единственный его минус? А если алгоритм вычисления релевантности заменить на свой, который будет устраивать, то тогда это уже не говноподелие? Опенсорс все-таки. Про lucene я знаю, но так и не попробовал в деле.

Если у системы полнотекстового *поиска* заменить алгоритм вычисления релевантности документа, это будет *другая* система полнотекстового поиска.

anonymous
(06.02.08 11:19:26 MSK)

Ответ на: комментарий от anonymous 06.02.08 11:19:26 MSK

> Если у системы полнотекстового *поиска* заменить алгоритм вычисления релевантности документа, это будет *другая* система полнотекстового поиска.

Фига. У tsearch2 и так два независимых алгоритма счета релевантности, а можно использовать хоть черта лысого (ну если сможете сформулировать алгоритм подсчета релевантности :) )

teodor ★
(06.02.08 11:22:27 MSK)

Ответ на: комментарий от teodor 06.02.08 11:22:27 MSK

>Фига. У tsearch2 и так два независимых алгоритма счета релевантности, а можно использовать хоть черта лысого (ну если сможете сформулировать алгоритм подсчета релевантности :) )

Значит, под одним названием на самом деле есть две разные поисковые системы с разнойвыдачей по одинаковым запросам. Ничего необычного.

anonymous
(06.02.08 15:25:29 MSK)

Ответ на: комментарий от anonymous 06.02.08 15:25:29 MSK

> Значит, под одним названием на самом деле есть две разные поисковые системы с разнойвыдачей по одинаковым запросам. Ничего необычного.

Э-э. Интересная позиция. У меня есть Линукс. Я могу запускать X'ы и работать в них, могу не запускать и работать в консоли. Значит ли это, что у меня два компьютера? две OS?

В задачи поисковой машины входит как поиск так и релевирование - это две РАЗНЫЕ задачи. Прямая аналогия: zip и tar. Tar только объединяет файлы, сжимают результирующий файл чем-нибудь другим (gzip, bzip2, zip наконец). Zip сразу решает обе задачи, но это не значит, что у него только одна задача.

Disclaimer. Современные онлайнвые поисковые машины на миллиарды документов (типа Google) часто смешивают эти процессы. Чисто для оптимизации. Честный поиск с честным релевированием не уложится в 1 секунду на выборке в миллиард документов на современных машинах. Поэтому применяются хитрые техники, позволяющие получить topN релевантных документов и только потом их отсортировать (и то, последний шаг не всегда обязателен)

teodor ★
(06.02.08 15:40:14 MSK)

Ссылка

Ответ на: комментарий от teodor 06.02.08 10:32:49 MSK

спасибо

>pgbouncer

это - костыль. тогда он будет узким местом. Он тоже форкает процессы, и теперь входящие запросы будут кьюится там. Потому как при 10к+ - процессов быть нигде не должно. Поэтому и написал про epoll.

оптимайзер тоже не могет быть умнее человека. Нужны механизмы управления им - если что-то не так (и если распределение объёмов данных в будущем меняться не будет) - когда он сходит с ума от десятков разных джойнов и начинает полные сканы где их можно не делать. Так в оракле и дб2 по крайней мере.

ещё раз спасибо за ответы

/Anode

anonymous
(06.02.08 17:31:44 MSK)

Ответ на: комментарий от anonymous 06.02.08 17:31:44 MSK

> это - костыль. тогда он будет узким местом. Он тоже форкает процессы, и теперь входящие запросы будут кьюится там. Потому как при 10к+ - процессов быть нигде не должно. Поэтому и написал про epoll.

Блин, ты бы с ним ознакомился. Он НЕ форкающийся и даже не на тредах. Он на select'ах. И поддерживает epoll/kqueue/что-там еще

> оптимайзер тоже не могет быть умнее человека. Нужны механизмы управления им - если что-то не так (и если распределение объёмов данных в будущем меняться не будет) - когда он сходит с ума от десятков разных джойнов и начинает полные сканы где их можно не делать. Так в оракле и дб2 по крайней мере.

Канечно не могет, у него есть всякие полезные твики. Но нет возможности в запросе указать "здесь используй индекс Куку" и не будет.

teodor ★
(06.02.08 17:52:37 MSK)

Ответ на: комментарий от teodor 06.02.08 17:52:37 MSK

посмотрел (кстати в коде еполл не вижу). Да он и не нужен мультиплексору, который проблему не решает (В конце-концов ниже уровнями всё вообще выстраивается в очередь и если это делается быстро и _параллельно_ - то будет прозрачно). Проблема по-сути остаётся: транзакция не может быть не атомик и в каждый момент времени мы обслуживаем, скажем, только 1к клиентов максимум, а не 10к и не больше (дальше можно клиентов делить на базы, базы синхпонизировать итд, но это уже костыли). А клиент (код аппликации) может долго держать транзакцию по разным причинам. Клиентов можно скейлить вширь, а базу - нет - она должна быть одна (хотя бы для дебит-кредита).

Anode

anonymous
(06.02.08 19:33:20 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

← Может ли KDE спасти умирающую платформу Windows?

Open Source

GNU GRUB 1.96 →

Похожие темы