LINUX.ORG.RU

Как автоматически повернуть скан и вырезать текстовый блок?

 , ,


0

2

Есть много отсканированных страниц с текстом, немного криво. В принципе, сойдет и так, но нужно в них лишний текст обрезать и лучше бы это сделать, устранив наклон и обрезав поля.

Нужно в командной строке найти блок текста (один на всю страницу) автоматически повернуть на 0 - 0.1 - 1.5 градуса и вырезать его. Угол поворота и обрезку программа должна определить сама, на основе анализа изображения.

Существует ли готовый инструмент для этого?

Самому писать некогда. Или придется?

Существует ли готовый инструмент для этого?

Попробуй unpaper. Он уже есть в составе большинства крупных дистрибутивов.

i-rinat ★★★★★ ()

Посмотрите на ScanTailor. Это интерактивная программа, но чертовски мощная.

anonymous ()
Ответ на: комментарий от anonymous

Поставил scantailor, пробую. С первого раза, по умолчанию, очень плохое качество получилось, совсем негодное. Ищу как ему отключить всю обработку кроме маскирования или настроить получше. Я тут попробовал, для сравнения, в фотошопе повернуть, в результате качество распознавания упало в несколько раз, хотя текст почти не изменился. Поэтому, думаю, пока ограничиться обрезкой по маске и сравнить результат с поворотом. Т.е. нужно сориентировать рамку текста под нужным наклоном и очистить всё, что вне маски.

MariaRTI ()
Ответ на: комментарий от hippi90

Спасибо всем! scantailor - то, что надо. Удается настраивать, результат хороший. Сравню, отпишусь.

MariaRTI ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.