LINUX.ORG.RU

Конвертирование djvu в pdf


0

1

Я вообще с трудом понимаю, нафига нужен djvu «/

Абсолютно неудобный формат, с кривыми ридерами.

В принципе есть програмы, чтобы его сконвертировать в pdf. Но хотелось-бы еще заодно сделать распознавание символов. Так и места будет меньше занимать и, что гораздо важнее на ebook-ридере будет гораздо удобнее читать.

Вот.

Хотел спросить нету ли какой программы для таких целей. Я же с трудом нашел, для простого конвертирования.


> Я вообще с трудом понимаю, нафига нужен djvu «/

Чтобы скан книги занимал 5 Мб а не 500

Абсолютно неудобный формат, с кривыми ридерами.

Пользуйтесь нормальными DE. В evince смотрятся что pdf, что djvu

В принципе есть програмы, чтобы его сконвертировать в pdf

1. Печать в файл pdf. 2. Поставить Djvu и пользовать внутренний конвертер.

annoynimous ★★★★★
()

>нафига нужен djvu
Для сканов с опциональным текстовым слоем. Занимает заметно меньше места, чем PDF. Распознавание не везде нужно.

сделать распознавание символов.

В смысле до конца? Это в сторону FineReader, но под линукс он жутко дорогой. В свободных распознавалках с форматированием беда.

x3al ★★★★★
()
Ответ на: комментарий от annoynimous

Evince - лучший среди djvu. Но ИМХО не самый удобный. Мне Foxit Reader больше нравится.

1. Печать в файл pdf. 2. Поставить Djvu и пользовать внутренний конвертер.

Это все понятно. Я хочу одним махом всю библиотеку сконвертировать.

Юзаю утитлиты djvu2pdf, но она принимает списком файлы.

Я пробовал сделать так «ls -1R ~/Books | grep .djvu | sed -e 's/^/»/' | sed -e 's/$/«/' | xargs -t djvu2pdf». Но во первых мой sed убивает переносы строки, а во вторых ls выдает относительные пути а нужны абсолютные.

uhbif19
() автор топика
Ответ на: комментарий от uhbif19

ого

открой для себя рекурсивный глоббинг (zsh и bash4.0). вместо
ls -1R ~/Books | grep .djvu
будет так
ls ~/Books/**/*.djvu

не знаю чем вы там конвертируете, совсем уж в идеальном идеале прокатит просто
djvu2pdf **/*.djvu

zolden ★★★★★
()
Ответ на: ого от zolden

Ух ты. Спасибо.

Я и забыл, что баш еще и ЯП :)

Вопрос, тем не менее остается открытым.

Попробую заюзать какой нибудь OCR

uhbif19
() автор топика
Ответ на: ого от zolden

Ну, замечательно.

Все предложенное не работает.

Ибо ls ~/Books/**/*.djvu возвращает такие-же обычные строки. Без кавычек. А в названиях пробелы.

uhbif19
() автор топика
Ответ на: ого от zolden

find /path/to/lib -name *.djvu -exec 'djvue2pdf {}' \; уже совсем не катит?

по теме, купи нормальную читалку и спокойно пользуй отличный формат djvu.

qnikst ★★★★★
()
Ответ на: комментарий от qnikst

Спасибо. Теперь работает.

Но он все складывает в домашнюю директорию, что не хорошо. Как я понял второй аргумент файл вывода, хотя в доке ни слова об этом.

Скажу еще пару слов про djvu.

по теме, купи нормальную читалку и спокойно пользуй отличный формат djvu.

Читать книгу картинками это конечно очень круто. У каждой книги свой формат страницы. И у ридера тоже. Текстовый формат можно нормально адаптировать. А картинку только туда сюда маштабировать.

Вы же не стали бы конвертить нормальный pdf (с текстом) в djvu ?

uhbif19
() автор топика
Ответ на: комментарий от Magic

[quote]Почти столько же iPad стоит.[/quote]
Не надо путать теплое с мягким, Вы просто не понимаеете разницы между ЖК и е-инк. Погуглите, будет интересно.
По ценам Amazon Kindle пока вне конкуренции:
Kindle Wi-Fi - 139$
Kindle 3G (Free 3G + Wi-Fi, 6") is available for $189.
Kindle DX (Free 3G, 9.7") is available for $379.
Плюс 20$ доставка в Украину. Предложите мне что нибудь дешевле такого же качества и начинки.

Quark_p
()
Ответ на: комментарий от Quark_p

если не умеет djvue, то в момент создания

qnikst ★★★★★
()

>Я вообще с трудом понимаю, нафига нужен djvu

Я вообще с трудом понимаю, нафига паковать сканированные книги в pdf

annulen ★★★★★
()
Ответ на: комментарий от uhbif19

>Evince - лучший среди djvu.

Открой для себя Okular

annulen ★★★★★
()
Ответ на: комментарий от megabaks

evince удобнее, не считая некоторых моментов выделения и копирования текста. Вобще можно держать djview, libpoppler-based читалку pdf и жить спокойно

qnikst ★★★★★
()

>Абсолютно неудобный формат, с кривыми ридерами.
Не более неудобный, чем PDF. Только места занимает в разы меньше.


Но хотелось-бы еще заодно сделать распознавание символов.

Сделай. Cuneiform с некоторого времени стал открытым, а работы там на всех хватит.

В любом случае всё упирается в отсутствие доделанных OCR-систем для этих наших Линуксов.

valentin_v13 ★★★
()
Ответ на: комментарий от uhbif19

> Читать книгу картинками это конечно очень круто. У каждой книги свой формат страницы. И у ридера тоже. Текстовый формат можно нормально адаптировать. А картинку только туда сюда маштабировать.

отмасштабировать каждую книгу 1 раз займёт 15 секунд (максимум) времени. В общем-то не очень большая цена. Хотя встречаются иногда умельцы делающие разные форматы страницы в рамках одной книги, но это уже им нужно руки отрывать.

Кстати в djvu есть возможность добавление текстовой подложки, для выделения, поиска, доставания текста.

Насчёт адаптации текстового формата, при наличии блоков кода, таблиц, картинок (особенно сделанных средствами pdf), при изменении размера текста с соответствующими вставками переносов всё начинает безбожно плыть.

Вы же не стали бы конвертить нормальный pdf (с текстом) в djvu ?

если он не занимает >50Мб, то не стал бы.

qnikst ★★★★★
()
Ответ на: комментарий от qnikst

Я вообще с трудом понимаю, нафига паковать сканированные книги в pdf

Я вообще с трудом понимаю, нафига выкладывать сканированные книги. Тем более под виндой с файнридером, где сидят большинство пиратов.

отмасштабировать каждую книгу 1 раз займёт 15 секунд (максимум) времени. В общем-то не очень большая цена. Хотя встречаются иногда умельцы делающие разные форматы страницы в рамках одной книги, но это уже им нужно руки отрывать.

Ну, во первых такое что начало книги по одному листу а дальше разворотами повсеместно бывает.

А у масштабирования есть адская проблема. Получается что надо, при чтении каждой строки перематывать влево-вправо. Это ад. Да еще на еинке так зарядка будет раз в 10 быстрее тратится. Но даже без этого неюзабельно.

Насчёт адаптации текстового формата, при наличии блоков кода, таблиц, картинок (особенно сделанных средствами pdf), при изменении размера текста с соответствующими вставками переносов всё начинает безбожно плыть.

Нифига. Ну, пдф не пробовал конечно, но читал уже несколько английских книг в амазоновском формате, с кодом и т.п. Смотрится отлично. А если код написан на моем любимом питоне то там и с переносами отлично смотрится. Тем более, что по питоновским Style Guide каждыая строка по 80 символов максимум => обычно не переносится.

uhbif19
() автор топика
Ответ на: комментарий от valentin_v13

Сделай. Cuneiform с некоторого времени стал открытым, а работы там на всех хватит.

О, да. Почему, почти на любой вопрос нужно написать о что надо это напрогать ?

Какое-то общее мнение, что что-бы что-то написать нужно лишь захотеть. А OCR это весьма специфическая область.

И есть множество намного более интересных опенсурс проектов.

Позиция чего-то нет => напрогать приводит либо к заброшенному, глючному проекту, либо к задротичному его допиливанию аля линус торвальдс.

Вот на таких последнем типе и держится опенсурс. Но ИМХО далеко не лучшая жизненная позиция.

uhbif19
() автор топика
Ответ на: комментарий от Quark_p

> Вы просто не понимаеете разницы между ЖК и е-инк. Погуглите, будет интересно

Игрался с Sony PRS950 во время перелёта USA -> Russia

eink - говно, рефреш медленный, со спец-эффектами, от которых вытекают глаза, нормально скролить диаграммы/текст нельзя, быстро пролистывать и просматривать книги - так же нельзя. Вывод - для чтения худ. лит подходит, но не более. Игрушка-с.

anonymous
()
Ответ на: комментарий от anonymous

Кто не понимает - попробуйте посмотреть, к примеру, схемы электрические принципиальные на eink и оцень удобства скроллинга и зума.

Про отстутсвие цветов молчу.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.