LINUX.ORG.RU

Сообщения isaecf

 

Создание структуры папок год-месяц-день

Форум — Admin

Всем добрый день! Есть работающий скрипт, который берет файлы *.pdf(все pdf-файлы состоят из двух страниц) с папки inputdir_picture, конвертирует их в *.jpg и с помощью tesseract распознает для того чтобы переименовать и положить эти файлы в папку outputdir_picture.

#!/bin/bash

# папка для необработаных файлов 
inputdir="./input_picture"
# папка для обработаных файлов
outputdir="./output_picture"


[ -d "$inputdir" ] || exit 1
[ -d "$outputdir" ] || exit 2

#tmpfile=$(mktemp || exit 3)
tmpfile=$(mktemp) || exit 3
status=0

#переменая  con
echo "Начался процесс конвертирования..."
for con in "$inputdir"/*.pdf; do
#сам процесс конвертирования
convert -density 150 "$con" "$con".jpg
rm -f "$con"
done

echo "Начался процесс переименования... "
#процесс переименнования
for f in "$inputdir"/*-0.jpg; do
    tesseract -l ukr "$f" - > $tmpfile
         rm -f "$inputdir"/*-1.jpg
#    fio=$(sed -rn 's/^[Яя][,.] (.*)/\L\1/; T lab; s/((^| ).)/\U\1/gp; q; :lab' "$tmpfile")
fio=$(sed -rn 's/^[Яя][,.] (.*)/\L\1/; T lab; s/((^|[- ]).)/\U\1/g; s/ Фото$//; p; q; :lab' "$tmpfile")
    if [ -z "$fio" ]; then
        orig=$(basename "$f")
        txt=${orig%.jpg}.txt
        echo ФИО не найдены в файле \"$f\", текст записан в \"$outputdir/$txt\"
        cp "$tmpfile" "$outputdir/$txt"
        # mv "$f" "$outputdir"
        status=4
    else
        mv "$f" "$outputdir/$fio.jpg"
    fi
done

#добавил хз зачем
rm "$tmpfile"

exit $status

Задача: Необходимо добавить возможность чтобы он создавал вместо структуру папок год->месяц->день и переносил переименованные файлы вместо outputdir_picture в папку «день», соответственно.

Всем огромное спасибо за помощь. Все предложение по улучшению работы скрипта принимаются!

 , , ,

isaecf
()

не создается swap файл

Форум — General

Имею в наличии Ubuntu 16.04.1 LTS.

Появилась необходимость создать файл подкачки (swap). Выполнял все действия как описаны в статье : http://mydebianblog.blogspot.com/2010/05/swap-swap-linux.html (о всех остальных статьях описания подобные).

При выполнении команды swapon

/swapfile 
swapon: /swapfile: не удалось выполнить swapon: Недопустимый аргумент

Кто знает в чем проблема и как ее решить?

Перемещено JB из ubuntu

 , ,

isaecf
()

bash скрипт+распознавание текста+и массовое переименнование

Форум — Admin

Задача следующая, которую хочу оптимизировать с помощью bash скрипта. Хочу предупредить что я в этом деле малознающий.

Есть каталог со сканированными изображениями в формате: сканирование.jpg сканирование1.jpg ... сканированиеN.jpg. В этих *jpg есть строка где указана фамилия имя отчество. Необходимо: эту строку распознать как текст и переименовать этот *jpg в котором распознавали и так все остальные...

Как вижу решения я(может и немного некорректное): С помощью imagemagic кадрировать строку с ФИО командой #convert -crop 830x60+80+235 input.jpg output.jpg в отдельный каталог и уже в этом каталоге с помощью #tesseract output.jpg 1.txt расспознавать текст, который потом необходимо использовать в названиях *jpg .

Далее я не знаю что мне делать. Будьте добры, помогите или скажите какого хода мыслей мне придерживаться?! Заранее спасибо!

 , ,

isaecf
()

debian + virtualbox --headless

Форум — Admin

Всем привет! Прошу мне помочь в одном вопросе. Есть у меня «сервачок» на debian (без графический), настроенный не мной... На нем было настроено virtualbox --headless, где была создана машина winXP(какая точно сказать не могу...) к которой по rdp подключались. В один прекрасный момент увидел что не работает, df -h показал 100% занятого места, освободил, но все равно не запускается...

#VBoxManage list vms ничего не показывает

но, # ps ax|grep irtual 1787 ? Sl 0:00 /usr/lib/virtualbox/VBoxHeadless --comment 1C --startvm c6f10afb-44bf-4efe-ac93-d665023acf92 --vrde config 4394 pts/0 S+ 0:00 grep irtual

прошу помочь разобрать в данном вопросе. Заранее спасибо

 , , ,

isaecf
()

RSS подписка на новые темы