LINUX.ORG.RU

Посоветуйте хранилово объектов с полнотекстовым поиском.


1

2

Хочу сохранить 10млн текстов размером до килобайта и кучу мелких записей, описывающих отдельные слова русского языка - все падежи, часть речи и т.п. Может быть ещё какие-то типы объектов - фразы, связи между словами (семантика всякая, онтологии, тезаурусы-куяурусы)... По текстам нужен полнотекстовый поиск (пох на морфологию), ну и обычные всякие там индексы по разным полям разных других записей...

Я бы заюзал postgresql в принципе, но мало-ли, может ещё чё-то есть крутое. MongoDB вот модная щас. Она мне нужна?

★☆

Последнее исправление: kiverattes (всего исправлений: 1)

MongoDB вот модная щас. Она мне нужна?

Нет, не нужна.
И нет, она уже не модная, ты опоздал года на три. Все ей уже наелись.

AnDoR ★★★★★
()

patricia trie, имхо. (если я правильно понимаю задачу)

invy ★★★★★
()
Последнее исправление: invy (всего исправлений: 1)

Любая более менее используемая DB (sql (postgress), nosql (couchBase, mongo, etc)) + движок (solr, elasticsearch, etc)

anonymous
()

mysql с его аналогами, а в качестве движка таблиц бери MyISAM

Готовые решения для «хранения» с блекджеком будут стоить денег и не факт что лучше в плане перформанса и надежности.

reprimand ★★★★★
()

Посмотри на elasticsearch.

Ian ★★
()

любая современная субд. модно сейчас масштабирование, ты хочешь сделать из этого кластер?

trashymichael ★★★
()
Ответ на: комментарий от kiverattes

Любую реляционную СУБД. В постгресе есть полнотекстовый tsearch2. В мускулях встроенного нету, но к нему прикручивают всякие sphinx.

AnDoR ★★★★★
()

Хранения текстов это одно, а полнотекстовый поиск и хранение его это другое. модно для последнего сейчас (как и всегда) solr.

vtVitus ★★★★★
()

Я бы заюзал postgresql

и прикрути Solr, если не вдаваться в религиозные срачи, этого тебе хватит полностью.

Alve ★★★★★
()
Ответ на: комментарий от reprimand

Готовые решения для «хранения» с блекджеком будут стоить денег и не факт что лучше в плане перформанса и надежности.

денег будет стоить и подгонка под конкретную задачу. Т.ч. тут надо Over9000 раз подумать, а надо-ли это УГ закрытое юзать?

emulek
()

Может, имеет смысл посмотреть на графовые базы?

undertaker ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.