Конвертирование djvu в pdf

0

1

Я вообще с трудом понимаю, нафига нужен djvu «/

Абсолютно неудобный формат, с кривыми ридерами.

В принципе есть програмы, чтобы его сконвертировать в pdf. Но хотелось-бы еще заодно сделать распознавание символов. Так и места будет меньше занимать и, что гораздо важнее на ebook-ридере будет гораздо удобнее читать.

Вот.

Хотел спросить нету ли какой программы для таких целей. Я же с трудом нашел, для простого конвертирования.

Ссылка

← mpd-0.16-2+cue sheet

Настройка и использование l2tp без пакета xl2tpd [Gentoo] →

> Я вообще с трудом понимаю, нафига нужен djvu «/

Чтобы скан книги занимал 5 Мб а не 500

Абсолютно неудобный формат, с кривыми ридерами.

Пользуйтесь нормальными DE. В evince смотрятся что pdf, что djvu

В принципе есть програмы, чтобы его сконвертировать в pdf

1. Печать в файл pdf. 2. Поставить Djvu и пользовать внутренний конвертер.

annoynimous ★★★★★
(01.01.11 21:58:14 MSK)

>нафига нужен djvu
Для сканов с опциональным текстовым слоем. Занимает заметно меньше места, чем PDF. Распознавание не везде нужно.

сделать распознавание символов.

В смысле до конца? Это в сторону FineReader, но под линукс он жутко дорогой. В свободных распознавалках с форматированием беда.

x3al ★★★★★
(01.01.11 22:00:00 MSK)

Ссылка

Ответ на: комментарий от annoynimous 01.01.11 21:58:14 MSK

Evince - лучший среди djvu. Но ИМХО не самый удобный. Мне Foxit Reader больше нравится.

1. Печать в файл pdf. 2. Поставить Djvu и пользовать внутренний конвертер.

Это все понятно. Я хочу одним махом всю библиотеку сконвертировать.

Юзаю утитлиты djvu2pdf, но она принимает списком файлы.

Я пробовал сделать так «ls -1R ~/Books | grep .djvu | sed -e 's/^/»/' | sed -e 's/$/«/' | xargs -t djvu2pdf». Но во первых мой sed убивает переносы строки, а во вторых ls выдает относительные пути а нужны абсолютные.

uhbif19 ★
(01.01.11 22:20:38 MSK) автор топика

Ответ на: комментарий от uhbif19 01.01.11 22:20:38 MSK

for i in $(ls | grep .djvu); do djvu2pdf $i; done

Magic
(01.01.11 22:41:48 MSK)

Ссылка

Ответ на: комментарий от uhbif19 01.01.11 22:20:38 MSK

ого

открой для себя рекурсивный глоббинг (zsh и bash4.0). вместо
ls -1R ~/Books | grep .djvu
будет так
ls ~/Books/**/*.djvu

не знаю чем вы там конвертируете, совсем уж в идеальном идеале прокатит просто
djvu2pdf **/*.djvu

zolden ★★★★★
(01.01.11 22:44:11 MSK)

Ответ на: ого от zolden 01.01.11 22:44:11 MSK

Ух ты. Спасибо.

Я и забыл, что баш еще и ЯП :)

Вопрос, тем не менее остается открытым.

Попробую заюзать какой нибудь OCR

uhbif19 ★
(01.01.11 22:57:56 MSK) автор топика

Ссылка

Ответ на: ого от zolden 01.01.11 22:44:11 MSK

Ну, замечательно.

Все предложенное не работает.

Ибо ls ~/Books/**/*.djvu возвращает такие-же обычные строки. Без кавычек. А в названиях пробелы.

uhbif19 ★
(02.01.11 10:52:49 MSK) автор топика

Ответ на: комментарий от uhbif19 02.01.11 10:52:49 MSK

find ~/Books -name '*.djvu' -exec djvu2pdf '{}' \;

Svoloch ★★★
(02.01.11 12:18:57 MSK)

Ссылка

Ответ на: ого от zolden 01.01.11 22:44:11 MSK

find /path/to/lib -name *.djvu -exec 'djvue2pdf {}' \; уже совсем не катит?

по теме, купи нормальную читалку и спокойно пользуй отличный формат djvu.

qnikst ★★★★★
(02.01.11 12:57:53 MSK)

Ответ на: комментарий от qnikst 02.01.11 12:57:53 MSK

Извинте, а что Amazon Kindle уже стал не нормальным?

Quark_p ★
(02.01.11 13:57:00 MSK)

Ответ на: комментарий от qnikst 02.01.11 12:57:53 MSK

Спасибо. Теперь работает.

Но он все складывает в домашнюю директорию, что не хорошо. Как я понял второй аргумент файл вывода, хотя в доке ни слова об этом.

Скажу еще пару слов про djvu.

по теме, купи нормальную читалку и спокойно пользуй отличный формат djvu.

Читать книгу картинками это конечно очень круто. У каждой книги свой формат страницы. И у ридера тоже. Текстовый формат можно нормально адаптировать. А картинку только туда сюда маштабировать.

Вы же не стали бы конвертить нормальный pdf (с текстом) в djvu ?

uhbif19 ★
(02.01.11 14:20:51 MSK) автор топика

Ответ на: комментарий от Quark_p 02.01.11 13:57:00 MSK

Amazon Kindle

Почти столько же iPad стоит.

Magic
(02.01.11 14:50:15 MSK)

Ответ на: комментарий от annoynimous 01.01.11 21:58:14 MSK

>Пользуйтесь нормальными DE
правильно - в кедах есть Okular

megabaks ★★★★
(02.01.11 14:59:39 MSK)

Ответ на: комментарий от Magic 02.01.11 14:50:15 MSK

[quote]Почти столько же iPad стоит.[/quote]
Не надо путать теплое с мягким, Вы просто не понимаеете разницы между ЖК и е-инк. Погуглите, будет интересно.
По ценам Amazon Kindle пока вне конкуренции:
Kindle Wi-Fi - 139$
Kindle 3G (Free 3G + Wi-Fi, 6") is available for $189.
Kindle DX (Free 3G, 9.7") is available for $379.
Плюс 20$ доставка в Украину. Предложите мне что нибудь дешевле такого же качества и начинки.

Quark_p ★
(02.01.11 18:45:46 MSK)

Ответ на: комментарий от Quark_p 02.01.11 13:57:00 MSK

если не умеет djvue, то в момент создания

qnikst ★★★★★
(03.01.11 13:15:05 MSK)

Ссылка

>Я вообще с трудом понимаю, нафига нужен djvu

Я вообще с трудом понимаю, нафига паковать сканированные книги в pdf

annulen ★★★★★
(03.01.11 13:17:24 MSK)

Ссылка

Ответ на: комментарий от uhbif19 01.01.11 22:20:38 MSK

>Evince - лучший среди djvu.

Открой для себя Okular

annulen ★★★★★
(03.01.11 13:18:52 MSK)

Ссылка

Ответ на: комментарий от megabaks 02.01.11 14:59:39 MSK

evince удобнее, не считая некоторых моментов выделения и копирования текста. Вобще можно держать djview, libpoppler-based читалку pdf и жить спокойно

qnikst ★★★★★
(03.01.11 13:26:27 MSK)

Ссылка

>Абсолютно неудобный формат, с кривыми ридерами.
Не более неудобный, чем PDF. Только места занимает в разы меньше.

Но хотелось-бы еще заодно сделать распознавание символов.

Сделай. Cuneiform с некоторого времени стал открытым, а работы там на всех хватит.

В любом случае всё упирается в отсутствие доделанных OCR-систем для этих наших Линуксов.

valentin_v13 ★★★
(03.01.11 13:29:00 MSK)

Ответ на: комментарий от uhbif19 02.01.11 14:20:51 MSK

> Читать книгу картинками это конечно очень круто. У каждой книги свой формат страницы. И у ридера тоже. Текстовый формат можно нормально адаптировать. А картинку только туда сюда маштабировать.

отмасштабировать каждую книгу 1 раз займёт 15 секунд (максимум) времени. В общем-то не очень большая цена. Хотя встречаются иногда умельцы делающие разные форматы страницы в рамках одной книги, но это уже им нужно руки отрывать.

Кстати в djvu есть возможность добавление текстовой подложки, для выделения, поиска, доставания текста.

Насчёт адаптации текстового формата, при наличии блоков кода, таблиц, картинок (особенно сделанных средствами pdf), при изменении размера текста с соответствующими вставками переносов всё начинает безбожно плыть.

Вы же не стали бы конвертить нормальный pdf (с текстом) в djvu ?

если он не занимает >50Мб, то не стал бы.

qnikst ★★★★★
(03.01.11 13:32:18 MSK)

Ответ на: комментарий от qnikst 03.01.11 13:32:18 MSK

Я вообще с трудом понимаю, нафига паковать сканированные книги в pdf

Я вообще с трудом понимаю, нафига выкладывать сканированные книги. Тем более под виндой с файнридером, где сидят большинство пиратов.

отмасштабировать каждую книгу 1 раз займёт 15 секунд (максимум) времени. В общем-то не очень большая цена. Хотя встречаются иногда умельцы делающие разные форматы страницы в рамках одной книги, но это уже им нужно руки отрывать.

Ну, во первых такое что начало книги по одному листу а дальше разворотами повсеместно бывает.

А у масштабирования есть адская проблема. Получается что надо, при чтении каждой строки перематывать влево-вправо. Это ад. Да еще на еинке так зарядка будет раз в 10 быстрее тратится. Но даже без этого неюзабельно.

Насчёт адаптации текстового формата, при наличии блоков кода, таблиц, картинок (особенно сделанных средствами pdf), при изменении размера текста с соответствующими вставками переносов всё начинает безбожно плыть.

Нифига. Ну, пдф не пробовал конечно, но читал уже несколько английских книг в амазоновском формате, с кодом и т.п. Смотрится отлично. А если код написан на моем любимом питоне то там и с переносами отлично смотрится. Тем более, что по питоновским Style Guide каждыая строка по 80 символов максимум => обычно не переносится.

uhbif19 ★
(16.01.11 14:51:35 MSK) автор топика

Ссылка

Ответ на: комментарий от valentin_v13 03.01.11 13:29:00 MSK

Сделай. Cuneiform с некоторого времени стал открытым, а работы там на всех хватит.

О, да. Почему, почти на любой вопрос нужно написать о что надо это напрогать ?

Какое-то общее мнение, что что-бы что-то написать нужно лишь захотеть. А OCR это весьма специфическая область.

И есть множество намного более интересных опенсурс проектов.

Позиция чего-то нет => напрогать приводит либо к заброшенному, глючному проекту, либо к задротичному его допиливанию аля линус торвальдс.

Вот на таких последнем типе и держится опенсурс. Но ИМХО далеко не лучшая жизненная позиция.

uhbif19 ★
(16.01.11 15:03:42 MSK) автор топика

Ссылка

Ответ на: комментарий от Quark_p 02.01.11 18:45:46 MSK

> Вы просто не понимаеете разницы между ЖК и е-инк. Погуглите, будет интересно

Игрался с Sony PRS950 во время перелёта USA -> Russia

eink - говно, рефреш медленный, со спец-эффектами, от которых вытекают глаза, нормально скролить диаграммы/текст нельзя, быстро пролистывать и просматривать книги - так же нельзя. Вывод - для чтения худ. лит подходит, но не более. Игрушка-с.

anonymous
(16.01.11 15:33:33 MSK)

Ответ на: комментарий от anonymous 16.01.11 15:33:33 MSK

Кто не понимает - попробуйте посмотреть, к примеру, схемы электрические принципиальные на eink и оцень удобства скроллинга и зума.

Про отстутсвие цветов молчу.

anonymous
(16.01.11 15:36:19 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← mpd-0.16-2+cue sheet

General

Настройка и использование l2tp без пакета xl2tpd [Gentoo] →

ого

Похожие темы