LINUX.ORG.RU

Каталогизация множества небольших текстов в формате doc


0

1

Имеется довольно большое количество довольно мелких разрозненных файлов на разных языках (человеческих, не ЯП) в формате m$ word (*.doc), созданных в OpenOffice и m$ office. Все свалено в несколько папок, но никак не упорядочено. А хотелось бы как-то классифицировать тексты, с возможностью раскидать их по датам, жанрам, языкам, а также по изданиям, в которых тексты публиковались. Вопрос очевиден: как это лучше осуществить. Необходимо, чтобы решение было лёгким в реализации, кроссплатформеным (win/linux) и основанным на распространённых технологиях.

Что приходит в голову:

1. Просто рассортировать всё по папкам и сделать директории типа «2005 год», «2008 год», «Опубликовано в газете N», «На ... языке», в которые покидать линки на файлы. Но это не слишком удобно и непроизводительно, придётся создавать по несколько линков на одни и те же файлы.

2. Водрузить на домашнюю машину PHP+Apache+MySQL и поставить на localhost какую-нибудь Joomla. Заполнить текстами из файлов и разбросать по категориям. Способ не самый простой и быстрый, хотя если все сделать «по уму», будет удобно.

3. Перегнать тексты из .doc в .fb2, заполнить для каждого текста данные о языке, публикациях и т.п., а потом воспользоваться любой готовой программой-каталогизатором fb2, коих сейчас много под разные системы.

Может быть, еще какие-то варианты есть? Буду признателен за идеи.

★★

Налепить к файлам тегов и натравить какой-нибудь nepomuk, strigi, beagle... что там ещё есть.

Lumi ★★★★★
()
Ответ на: комментарий от darkshvein

>Ты забыл разлогиниться!

Зачем? Чтобы оффтопик назвать оффтопиком - уже нужно «разлогиниваться»?

Led ★★★☆☆
()
Ответ на: комментарий от adriano32

Не, просто подумалось, что ТС уже засветился, глянув на кучу тем в дженерал с перечёркнутыми авторами.

Lumi ★★★★★
()
Ответ на: комментарий от darkshvein

Да кто их знает. Хотя, ТС после вопроса в теме не отписывается. Это странно.

Lumi ★★★★★
()
Ответ на: комментарий от Lumi

Налепить к файлам тегов и натравить какой-нибудь nepomuk, strigi, beagle...

Спасибо за идею! Попробую.

LexArt ★★
() автор топика
Ответ на: комментарий от darkshvein

Почитал сейчас про recoll, выглядит интересно. В принципе, можно продумать понятную структуру каталогов и искать в них recoll'ом.

LexArt ★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.