LINUX.ORG.RU

mnoGoSearch 3.3.8

 


0

0

Поисковик mnoGoSearch обновлён до версии 3.3.8.

"Многосёрч" - это пара программ для организации поиска в небольших сетях, а именно краулер, обходящие документы сети и сохраняющий информацию о найденных в них словах в базе данных SQL, а также приложение CGI, выполняющее поиск документа по записям в базе данных, сделанным индексатором.

"Многосёрч" может работать с базами данных MySQL, PostgreSQL, SQLite, iODBC, unixODBC, EasySoft ODBC-ODBC bridge, Mimer, Virtuoso, Interbase, Oracle, MS SQL, DB2, Sybase; с сетевыми протоколами HTTP, HTTPS, FTP, HTTP-proxy, NNTP, имеет встроенную поддержку (может индексировать) text/plain, text/html, text/xml, с помощью сторонних парсеров - любые форматы документов (PDF, DOC, DjVu, JPG, ...)

"Многосёрч" может искать целые фразы, неточные слова, блестяще справляется со всеми кодировками - в том числе с их автоматическим распознаванием.

>>> Сайт проекта

☆☆

Проверено: Shaman007 ()

Скрин вебморды подкиньте, а то у меня жесткое дежавю, а посмотреть негде, какжись я это юзал.

wfrr ★★☆
()

А что у них с лицензией?

f3ex ★★
()

А оно умеет лазить по расшаренным по самбе ресурсам и потом искать файло через вебморду?

Alve ★★★★★
()

как я понимаю - до хадупа над люцином и прочих надстроек - ему как до китая раком, не говоря о том что оверхед реляционки и дополнительного клиент-сервера - надо полагать не маленький (все индексы реализованные в базах с которыми сталкивался - жутко тормозные по сравнении с прямым доспупом к грамотно реплицированным/подменяыемым ISAM-файлам, даже без хадупа) и пр.
Хадуп используется яхой и другими и является аналогом гуглового мапредусе.
Знатоки или те кто пользовал и то и то - поправьте если что.

Anode
()
Ответ на: комментарий от overmind88

tsearch2 тоже сливает люцине
http://www.semanticlab.net/index.php/Image:Lucene_vs_tsearch.jpg

Люцина скейлится хорошо (контент педивикии например), где сёрчи в базах почему-то сливают. Хотя почему постгре например не мог-бы использовать люцине внутри? И производительность и масштабирование были-бы на уровне.

Anode
()

Sphinx рулит и педалит. Хотя у них разные класса. Сабж - это web-краулер. Зачем нужен дома - малопонятно. Spinx - идеальное решение для поиска по своим сайтам. Высокая скорость индексации, использование дельт индексов, прямая работа ведение своих критериев индексации и т.п...

KRoN73 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.