SQL-запрос (postgresql / tsearch2)

fulltext search, postgresql, tsearch2, tsvector

0

1

Помогите поправить запрос, уже что то не могу сообразить. Простая таблица: id | player | message | time.

Хочу посчитать количество употребления слов в таблице за последние сутки таким запросом:

select nentry,word AS normal,to_tsvector('ru',word) AS inf
from ts_stat('select to_tsvector(message) from tw_chat where time>now()-INTERVAL ''1 week''')
WHERE nentry>1 AND length(word)>=4 
ORDER BY nentry DESC LIMIT 2000

В общем он работает как нужно, возвращает таблицу в виде «количество слов | слово | начальная форма слова (to_tsvector('ru',word))».

Хочется сгрупировать в этом результате все слова по их начальной форме, То есть, например, чтобы слова «прыгай» и «прыгал» образовали одну запись вместо двух. Обычный GROUP BY не подходит потому что в результате мне нужна первая и вторая колонка, следовательно GROUP BY можно делать только по ней. Во второй колонке хочу получить употребленное слово этой формы(видимо любое из слов «прыгай» и «прыгал» в примере)

Ссылка

← Нет вывода в div через JQuery

Об архитектуре сайтов типа jsfiddle →

Нужно это для такой штуки: http://disarmer.ru/tee/tee/_cloud_stat/chat_week.svg

disarmer ★★★
(09.03.13 00:16:43 MSK) автор топика

Ссылка

В мускуле есть чего-то типа pronounce() или как-то так. в ПГ должно быть по-любому. Сравнивает произношение слов.

ziemin ★★
(09.03.13 00:22:58 MSK)

Ответ на: комментарий от ziemin 09.03.13 00:22:58 MSK

нене, произношение мне не нужно, нужно идею как сгруппировать результат этого запроса. Вроде это должно быть просто, только в голову ничего не приходит

disarmer ★★★
(09.03.13 00:36:56 MSK) автор топика

Ссылка

То есть, например, чтобы слова «прыгай» и «прыгал» образовали одну запись вместо двух

в результате мне нужна первая и вторая колонка

Тогда что-то типа

select sum(nentry),min(word) AS normal,to_tsvector('ru',word) AS inf
from ts_stat('select to_tsvector(message) from tw_chat where time>now()-INTERVAL ''1 week''')
WHERE nentry>1 AND length(word)>=4 
ORDER BY nentry DESC LIMIT 2000
GROUP BY to_tsvector('ru',word)

monk ★★★★★
(09.03.13 18:01:31 MSK)