LINUX.ORG.RU

Сентябрьская PostgreSQL-встреча: про полнотекстовый поиск от авторов

 , ,


0

0

После летнего перерыва рады объявить о том, что 16-го сентября (вторник) в Москве планируется очередная, сентябрьская встреча всех тех, кто использует, начинает использовать или просто интересуется PostgreSQL. На этот раз мы поговорим о полнотекстовом поиске PostgreSQL, о том, как правильно его настраивать (прежде всего, при работе с русским и английским языками), о всех многочисленных возможностях FTS в PostgreSQL версии 8.3. С докладом-демонстрацией «Возможности полнотекстового поиска PostgreSQL» выступят Фёдор Сигаев (разработчик FTS в PostgreSQL) и Иван Золотухин. А об интересных новых разработках движка полнотекстового поиска и о планах расскажет Олег Бартунов (также разработчик FTS).

Как всегда, вход свободный, но из-за пропускного режима и ограниченного количества мест требуется предварительная регистрация: http://blog.styleru.net/register/.

Встреча проводится при поддержке клуба «Бизнес в стиле .RU», начало в 19:00 16-го сентября, место проведения: ул. Мясницкая, д. 20 (подробная информация — при регистрации).

Приглашаем всех желающих!

>>> Подробности



Проверено: anonymous_incognito ()
Последнее исправление: maxcom (всего исправлений: 1)

Ответ на: комментарий от phasma

где можно будет найти докладчиков в каком-нить огг ?

phasma ★☆
()

А где бы оно почитать потом? А то понаезжать совершенно нет возможности, а вот как варить Postgres послушать всегда было бы интересно.

<нацпол>Алсо, понимаю что это название, но слова «Бизнес в стиле .RU» доверия не внушают, лол. У нас до сих пор бизнес огромные мигающие флеш-баннеры вешает, когда весь мир уже много лет текстовую адаптивную рекламу твикает, повышая ее качество незаметностью...</нацпол>

anonymous
()

А, лол, насколько трудоемко будет перенести БД из нескольких сотен таблиц и хранимых процедур с MSSQL на эту постгре или как там она?

anonymous
()

не ну это реально ¤¤при поддержке клуба «Бизнес в стиле .RU»º¤¤ сайты завешаные всякими зафаршмачеными мигающими банерами где инфу хер увидеш это «Бизнес в стиле .RU» жесть!!!+1

kb0t_tk
()

Мероприятие полезное, однозначно.

MiracleMan ★★★★★
()

Да шоб они были здоровы со своим полнотекстовым поиском, лучше бы рассказали как count(*) заставить шустро работать на большом количестве записей.

anonymous
()
Ответ на: комментарий от anonymous

"как обычно" при подобной миграции, "лол" - будут говорить увидевшие ее участников, по окончании. те - нескоро.

p.s. описание не хаарктеризует сложность проекта. но небыстро. неделю мб. отладка - 2x по столько-же. особливо для незнакомых с платформой.

anonymous
()

Как раз на прошлой неделе почитал про полнотекстовой поиск в постгресе. Думаю его заюзать вместо lucene в новом проекте.

Так что приду послушать...

Qasta
()

А чем этот постгресовый поиск отличается от Sphinx? Ну за исключением того, что Sphinx поддерживает несколько СУБД.

anonymous
()

Вот почему организатор узнает о самом мероприятии с ЛОРа а не от тех, кто собрался его проводить? Не удивляюсь, что новости у нас появляются за пару дней. Если повезет то постараемся устроить трансляцию и выложить запись в проприетарных форматах (бейте организаторов).

anonymous
()
Ответ на: комментарий от anonymous

У меня на 660000 записей count(*) быстрее работает чем count(pk). Они оба используют "seq scan" по умолчанию, так что проблема актуальна.

anonymous
()
Ответ на: комментарий от matumba

Полнотекстовый поиск -- поиск минимум с учетом морфологии (то есть ищем не подстроку, а слово в любом склонении и форме). Но это нестрогое определение.

Postgresmen
() автор топика
Ответ на: комментарий от anonymous

Нам кажется, что FTS в PostgreSQL лучше, чем Sphinx сразу по многим параметрам. Мы пригласили на встречу разработчика Sphinx, Андрея Аксенова, но он, к сожалению, будет не в Москве в это время. На конференции Highload++ или на октябрьской встрече сообщества PostgreSQL (она будет в районе 6 октября), думаю, получится всех собрать и устроить сравнительную демонстрацию/бенчмарк или что-то вроде этого. Должно быть очень интересно, следите за анонсами.

Postgresmen
() автор топика
Ответ на: комментарий от anonymous

Встреча посвящена FTS, но это не значит, что она ограничена обсуждением поиска. Приходите, спросите про count(*) или задайте другие интересующие вопросы и мы вам все подробно объясним. Проблема вполне решаема.

Postgresmen
() автор топика
Ответ на: комментарий от Tzong

Tzong, к сожалению, это издержки большой загруженности всех докладчиков. Как показывает опыт, заранее все спланировать абсолютно невозможно. Поэтому мы радуемся когда получается организовать встречу хотя бы за неделю. Поверьте, это все очень нелегко. Спасибо, всем кто помогает. Просим простить за объявление практически в последний момент.

Могу также неофициально сообщить, как говорил выше, что где-то в районе 6 октября будет следующая встреча сообщества PostgreSQL, скорее всего в том же месте. Мы привезем на нее сразу 2 разработчиков из компании Skype (у них все работает на PostgreSQL) и технического директора популярной американской социальной сети myyearbook.com (проект в пару раз больше самых крупных проектов в Рунете и тоже работает на PostgreSQL). Планируйте свое время и следите за анонсами!

Postgresmen
() автор топика
Ответ на: комментарий от anonymous

>Это как раз таки просто - count(pk)

У postgresql есть хорошо известная проблема. Даже если есть индекс, при запросе данных всё равно требуется просмотр таблицы. Такая особенность реализации MVCC. Индекс просто уменьшает в некоторых случаях число просматриваемых блоков.

anonymous
()
Ответ на: комментарий от anonymous

> Вот почему организатор узнает о самом мероприятии с ЛОРа а не от тех, кто собрался его проводить? Не удивляюсь, что новости у нас появляются за пару дней.

LOL :-D

anonymous
()
Ответ на: комментарий от Postgresmen

Спасибо за ответ, к сожалению в моем случае не рационально (и некогда) ехать в Москву, оставить позади несколько тысяч километров, для того чтобы задать несколько интересующих меня вопросов.

anonymous
()
Ответ на: комментарий от pinachet

Надо уже skype-конференцию в реал-тайме организовывать. А то за неделю нереально сорваться.

gods-little-toy ★★★
()
Ответ на: комментарий от anonymous

>Вот почему организатор узнает о самом мероприятии с ЛОРа а не от тех, кто собрался его проводить? Не удивляюсь, что новости у нас появляются за пару дней. Если повезет то постараемся устроить трансляцию и выложить запись в проприетарных форматах (бейте организаторов).

побей сам себя

anonymous
()

Жаль, что не буду в Москве.

Кто будет - пожалуйста, спросите у них, когда

select count(*) from table

Перестанет перебирать последовательно все записи таблицы и начнет использовать индекс? На таблице c 500 тыс записей запрос длится

На несчастном миллионе записей агрегатные функции тормозят безбожно.

А еще, когда поиск tsearch2 по тому же миллиону записей (словарный запас около 10 000 слов, длина 1..10 слов) будет отрабатывать в приемлемое время? 0.5 секунды - долговато для веб-сервера.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.