LINUX.ORG.RU

Нужен лёгкий fulltext search engine: для C++ приложения, чтобы умел в en/ru, бесплатный.

 


1

1

Посоветуйте сабж?

Необязательно чтобы прямо либой линковался (хотя весьма желательно), на худой конец можно и через сокет.

Я в курсе, что индустриальный стандарт де факто - elasticsearch, но это чёртова зверюга.

Lucene тоже на жаве. Жаву тащить в дистрибутив приложения категорически не хочется.

★★★★★

Последнее исправление: dimgel (всего исправлений: 2)
Ответ на: комментарий от einhander

Может и подходит, я просто впервые о нём слышу (в отличие от). Для того вопрос и задал. Пока что склоняюсь в пользу lucene++:

dimgel ★★★★★
() автор топика
Последнее исправление: dimgel (всего исправлений: 3)
Ответ на: комментарий от dimgel

Я довольно давно и часто использую программу поиска документов - recoll. Там как раз под капотом используется xapian. Кроме здоровенной базы в 50Гб и соответственно ее загрузки, других недостатков нет, ищет очень быстро. На меньших базах загрузка моментальная.

einhander ★★★★★
()
Ответ на: комментарий от einhander

50гб текста? Или документов с картинками и прочим?

У меня по почте notmuch ищет (это внутри xapian), ее гигабайт 15. Никаких задержек не замечал ни разу. Но собственно текста там малая доля, конечно.

akho
()
Ответ на: комментарий от fluorite

Очередная зверюга: внешний процесс, коннект через сокет, json/sql. И в репах отсутствует. Нафиг.

dimgel ★★★★★
() автор топика
Последнее исправление: dimgel (всего исправлений: 1)
Ответ на: комментарий от akho

Где-то 2 Тб вордовский файлов, тхт, csv и pdf и всякого такого рода, плюс около 2 Тб всякой медиа типа чертежей, картинок и 3д моделей. База поиска всего этого занимает около 50 Гб.

einhander ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.