LINUX.ORG.RU
ФорумTalks

[ищу, совет] Open source web search engine


0

1

Многоуважаемый all,

кто-то имел дело с поисковыми движками (по вебу, не локальных файлов или в LAN) под open source лицензиями.

Гугл я уже спросил, интересует мнение завсегдатаев.


Помню только dpsearch/mnogosearch. Одно форк другого, не помню точно, кто чей. Вполне себе работал, но меня наняли только поставить и запустить, насколько хорошо он искал, и сколько с ним геморроя было дальше, не знаю.

rusty_angel
()

* htdig - древний, не развивается, последний релиз - 2004 года, не поддерживает юникод. Работал. Есть в дистрибутиве. Может сам собирать контент с веб-страниц

* DataPark Search - В целом подходит, единственный раз работал. Повторить не удалось. Может сам собирать контент с веб-страниц или с локальных файлов. Не удалось запустить поиск по индексированному, не выдает ссылки, хотя документы считает

* Sphinx - развивается, тестовый вариант запустился. Не умеет самостоятельно лазить по веб-страницам (в инете есть костыли на базе wget+bash, которые сграбливают сайты и подсовывают их Сфинксу, после чего тот это дело индексирует), больше предназначен для работы с конкретными проектами (например, шерстить базу локального форума, вики, etc)

* MnogoSearch - единственный индексатор, который адекватно работал. То ли он является клоном DataPark Search, то ли наоборот, но они очень похожи по внутреннему устройству

(c) /me

YAR ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.