LINUX.ORG.RU

Recoll 1.20.1

 , ,


2

2

Вышла новая версия десктопного поисковика Recoll — 1.20.1. Это первый за многие месяцы выпуск после 1.19. Recoll позволяет индексировать файлы на всём диске или в выбранных директориях и искать их через удобный графический интерфейс. Поиск производится по всему тексту с учётом морфологии и нечётких совпадений (используется поисковый движок Xapian). Поддерживается множество различных форматов файлов, хотя для некоторых форматов требуются внешние программы. По словам авторов, Recoll может найти даже текст в документе Microsoft Word внутри электронного письма в базе данных Thunderbird, упакованной в zip-архив. Или, например, в документе PDF. И потом открыть этот документ PDF в просмотрщике прямо на нужной странице.

Программа написана большей частью на C++ и Qt, но имеет также API для Python. Лицензия — GNU GPL версии 2 или новее. Можно интегрировать её с Ubuntu Unity в виде Recoll Lens, но этот компонент распространяется отдельно.

В новой версии:

  • Добавлена функция Open With (выбор программы для открытия файла).
  • Слегка изменён синтаксис запросов.
  • Добавлена настраиваемая «палитра» кнопок для добавления частей запроса. С её помощью пользователь может составлять запросы со специальным синтаксисом, даже если не помнит этого синтаксиса или запрос типовой, но слишком длинный, так что проще нажать кнопку, чем печатать.
  • Теперь можно искать только в истории посещённых веб-страниц или, наоборот, исключая историю посещённых веб-страниц.
  • Некоторые изменения в парсере текстов. Например, он теперь правильно индексирует #хэштеги.
  • Расширены возможности по настройке интерфейса.

О прочих изменениях можно прочитать в примечаниях к выпуску. Тем, кто будет обновляться с предыдущей версии, авторы советуют вручную удалить старый индекс файлов.

Домашняя страница Recoll

Репозиторий на Bitbucket

>>> Страница выпуска 1.20.1

Очень круто, если все так, как заявлено. Хотя лучше всего хранить информацию так, чтобы потом не приходилось ее искать.

Deleted ()
Ответ на: комментарий от Deleted

Очень круто, если все так, как заявлено.

В целом есть ряд неотшлифованных мест, конечно (например, «ввиду особенностей работы Xapian, если вы нажмёте „Отмена“, программа выключится»), но в целом да, всё работает хорошо. Главное только все вспомогательные программы установить.

proud_anon ★★★★★ ()
Последнее исправление: proud_anon (всего исправлений: 1)
Ответ на: комментарий от proud_anon

«ввиду особенностей работы Xapian, если вы нажмёте „Отмена“, программа выключится»

И в этой версии та же древняя проблема? Разработчики Xapian патчи не принимают, что ли?

anonymous ()

А вообще - нужно, да. Незаменимая штука, создал индекс для гигабайта текстов - и ищи себе.

anonymous ()
Ответ на: комментарий от anonymous

индекс для гигабайта текстов

Сабж, кстати, один из самых быстрых индексеров. И 10Gb в лёгкую проворачивает.

Suigintou ★★★★ ()
Последнее исправление: Suigintou (всего исправлений: 1)

ничего себе, даже ебилды в портаге есть.

vim ()

Как тяжело лялеховодам без Spotlight.

medik ★★★ ()
Ответ на: комментарий от Hertz

В комментах пишут, что индексатор годный и скорость отличная. А так как ты вряд ли являешься его разработчиком, прекращай пузыри пускать из носа, тулкитофоб. =))

sluggard ★★★★★ ()
Ответ на: комментарий от dearboy

Смотрел на то что было до балу. Все эти стриги с непомуками просто тормозное гогно по сравнению с реколлом. Поэтому и отключаются.

anonymous ()
Ответ на: комментарий от greenman

Смотрел только на clucene - пациент скорей мёртв. Думаю что с lucene++ то же самое, но надо глянуть. Из всего что с ним связано живое только pylucene, но оно через жаву работает.

В принципе, Xapian то юзабелен. Тот же Strigi в кедах работал через него, хотя там есть и Lucene бэкенд.

dearboy ()
Ответ на: комментарий от anonymous

Поддерживаю. Проиндексировал всю папку с книжками, сижу и радуюсь. И автор враз находится, и упоминания об авторе у других авторов. Результаты отлично смотрятся в табличке,есть предпросмотр с нужным местом. Очень нужно.

anonymous ()

А каковы реальные применения ее на десктопе? Кто-то пользуется?

sehellion ★★★★★ ()

Ребят, юзабельно? Или ненужная поделка?

Desmond_Hume ★★★★★ ()
Ответ на: комментарий от vurdalak

Чем оно лучше baloo?

Тем, что оно работает, и настроек там чуть более чем одна строка ввода.

Suigintou ★★★★ ()
Ответ на: комментарий от BillDver

Грепать по гигабайтам текста в разной кодировке, да ещё лежащего в различных контейнерах (иногда и со сжатием) немного нерационально.

Suigintou ★★★★ ()
Ответ на: комментарий от BillDver

qos - доли секунды и несколько десятков ссылок док,пдф,хлс, зип-внтури-пдф и т.д. Всё это с возможностью предпросмотра сразу - из 500Гиг инфы на нескольких винтах. Но любители и дальше могут трахаться с файндом-грепом и спрашивать: так что-же такого могут поисковики, что греп не может.

anonymous ()
Ответ на: комментарий от BillDver

ну-ну

find - не вариант, если искать по всей системе (уж лучше для таких случаев использовать locate, тоже индексер, но по названиям файлов)

grep - не вариант, если формат нетекстовый или непонятно что с кодировками

grep - не вариант, если надо «по всему тексту с учётом морфологии и нечётких совпадений» (т.е. если ищите по содержимому документов, содержащих человеческий текст - с падежами, склонениями, описками и тп)

anonymous ()
Ответ на: комментарий от Suigintou

Грепать по гигабайтам текста в разной кодировке, да ещё лежащего в различных контейнерах (иногда и со сжатием) немного нерационально.

И откуда это у вас, эти гигабайты текста?

Deleted ()
Ответ на: комментарий от Suigintou

Ну и сколько ее там может быть? Или ты Плюшкин, который собирает весь мусор с интернетов, авось пригодится? Если есть книга/дока — я даю ей осмысленное название с автором, годом. Если я решил оставить, я приблизительно понимаю о чем там. Зачем сабж?

Deleted ()
Ответ на: комментарий от Deleted

Зачем сабж?

Цитатку найти.

собирает весь мусор с интернетов, авось пригодится?

Понадобилось/понравилось - сохронил. Не попадал в ситуацию, когда доку удаляли (иногда вместе со всем сайтом)?

Suigintou ★★★★ ()

PDFы индексирует, а пост-скрипты почему-то — нет... :) А уж казалось бы. :) Правда, справедливости ради, я тут устанавливаю более старую версию. Может — поэтому? А, в целом, утилита, кажется, нужная.

gns ★★★★★ ()
Ответ на: комментарий от Suigintou

Даже вендоюзерам перестало быть нужно 10 лет назад

Починено.

Да и было это уже в linux.

Я и говорю – баянная программа.

anonymous ()
Ответ на: комментарий от Deleted

Пользователь вконтагтега? Таким действительно много книг, с поиском по ним, не надо. Так же им не надо больше 2-3 закладок в броузере. Расскажи как мне именовать файлы так что бы найти нужную инфу. Спектр книг: все по езернету, fc, софтовые документы по многим приложениям, переписка по почте, отдельные сохранённые статьи, факи и хаутушки;

история, биология, антропология, этология, социология, управления бизнес-процессами, маркетинг - это хобби такое.

Теперь мне надо найти всё что можно по qos. Надеюсь ты в курсе что книг по данной теме и возможностям больше чем одна?

anonymous ()

А мне больше нравится путь KDE, где индексированный поиск встроен в де и различные приложения - это надо расширять и развивать. Внешняя, сторонняя программа - менее удобно. И встраиваемость в юнити не имеет значения, т.к. этого юнити по сути нигде кроме убунты нет.

ps. Приобщайтесь к развитию и популяризации KDE :)

Lennier ★★★★ ()
Ответ на: комментарий от Lennier

А мне больше нравится путь KDE, где индексированный поиск встроен в де и различные приложения - это надо расширять и развивать.

Ага, только, во-первых, поиск этот работал (раньше, по крайней мере) так, что народ от него плевался, а во-вторых, «все приложения» — это все приложения из KDE. У меня Firefox в качестве браузера и Thunderbird в качестве почтовика — вот, уже 2 основных места, где что-либо часто приходится искать, вне KDE.

Кстати, у recoll'а есть kioslave/kio_recoll и recoll-applet для KDE, хотя и в экспериментальной стадии.

proud_anon ★★★★★ ()
Последнее исправление: proud_anon (всего исправлений: 2)
Ответ на: комментарий от anonymous

Скачиватель либрусека? Ок, пускай этот софт ищет в pdf/doc. А вдруг (вдруг, я даже не понимаю, для чего поиск по pdf присобачивать) мне нужно ещё и в картинках текст находить? OCR встроено?

anonymous ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.