LINUX.ORG.RU

Как автоматически повернуть скан и вырезать текстовый блок?

 , ,


0

2

Есть много отсканированных страниц с текстом, немного криво. В принципе, сойдет и так, но нужно в них лишний текст обрезать и лучше бы это сделать, устранив наклон и обрезав поля.

Нужно в командной строке найти блок текста (один на всю страницу) автоматически повернуть на 0 - 0.1 - 1.5 градуса и вырезать его. Угол поворота и обрезку программа должна определить сама, на основе анализа изображения.

Существует ли готовый инструмент для этого?

Самому писать некогда. Или придется?



Последнее исправление: MariaRTI (всего исправлений: 1)

Существует ли готовый инструмент для этого?

Попробуй unpaper. Он уже есть в составе большинства крупных дистрибутивов.

i-rinat ★★★★★
()

Посмотрите на ScanTailor. Это интерактивная программа, но чертовски мощная.

anonymous
()
Ответ на: комментарий от anonymous

Поставил scantailor, пробую. С первого раза, по умолчанию, очень плохое качество получилось, совсем негодное. Ищу как ему отключить всю обработку кроме маскирования или настроить получше. Я тут попробовал, для сравнения, в фотошопе повернуть, в результате качество распознавания упало в несколько раз, хотя текст почти не изменился. Поэтому, думаю, пока ограничиться обрезкой по маске и сравнить результат с поворотом. Т.е. нужно сориентировать рамку текста под нужным наклоном и очистить всё, что вне маски.

MariaRTI
() автор топика
Ответ на: комментарий от hippi90

Спасибо всем! scantailor - то, что надо. Удается настраивать, результат хороший. Сравню, отпишусь.

MariaRTI
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.