DjVuLibre 3.5.24 и DjView4 4.7

djview4, djvu, djvulibre, opensource, qt

Тихо и незаметно 6 марта вышла обновлённая версия набора утилит для работы с файлами в формате DjVu — DjVuLibre 3.5.24, в том числе версия 4.7 просмотрщика файлов в формате DjVu — DjView4, целиком написанного на Qt4.

DjVuLibre это открытый проект по разработке компрессора изображений в формат DjVu, сборщика DjVu-файлов, ряда утилит для манипуляций с файлами данного формата, просмотрщика для X11, а также ряда конвертеров в другие открытые форматы. Кроме вышеперечисленного в состав DjVuLibre входит плагин для просмотра DjVu-файлов в браузерах Netscape-4.x, Netscape-6.x, Mozilla, Galeon, Konqueror и Opera.

Напомним, что DjVu — открытая технология и формат файла, предназначенный для сжатия с потерями чёрно-белых и цветных изображений с возможностью добавления в полученный документ текстового (OCR) слоя и ссылок. При сжатии используются алгоритм IW44, основанный на вейвлет-преобразовании, и алгоритм JB2, подобный JBIG2.

Технология, применяемая для сжатия изображений в DjVu, была разработана AT&T Labs в 1996, в данный момент права на технологию принадлежат компании Caminova.

Исходный код DjVuLibre

Исходный код DjView4

О технологии

>>> Подробности

Ссылка

← The Haskell Platform 2011.2

Вышел TagLib 1.7 →

← 1 2 →

Кошерный формат. Жаль, мало используется. Да и в основном для сканированного ворованного контента. А мог бы и jpeg потеснить сильно.

~~timur_dav~~ ☆☆☆☆☆
(11.03.11 09:30:07 MSK)

Что-то я чейнджлог нигде не вижу.

petrosyan ★★★★★
(11.03.11 11:29:41 MSK)

Ответ на: комментарий от petrosyan 11.03.11 11:29:41 MSK

В исходниках же :)

~~timur_dav~~ ☆☆☆☆☆
(11.03.11 12:06:59 MSK)

Ссылка

Ответ на: комментарий от petrosyan 11.03.11 11:29:41 MSK

Именно в тарболах :)

Для Ъ выкладываю, несмотря на то, что сию же минуту посыпятся голоса «минорщина»:

DjVuLibre
NEW IN VERSION 3.5.24
---------------------
- Set ddjvuapi_version to 20.
- Added ddjvuapi support for changing the white point.
- Added option "-u" in djvused.
- Added option "-o djvufile" in djvuxmlparser.
- Added support for <CHARACTER> tag in djvuxmlparser.
- Added print-xmp, set-xmp, remove-smp in djvused.

DjView4
NEW IN VERSION 4.7
--------------------
- Fix for crash on quick PgUp PgDn sequences.
- Fix scrollbars in continuous mode.
- Fix plugin for some webkit based browsers.

~~adriano32~~ ★★★
(11.03.11 12:59:33 MSK) автор топика

Ссылка

хорошая программа на Qt, рекомендую;
вот бы что-то подобное, но для pdf найти... если кто знает - поделитесь инфой

NK ★★★★★
(11.03.11 17:45:43 MSK)

Ответ на: комментарий от NK 11.03.11 17:45:43 MSK

adobe reader

enep ★★★★★
(12.03.11 15:40:25 MSK)

Ссылка

А у JavaDjVu никаких телодвижений нет. Печально

proDOOMman ★★
(12.03.11 15:52:18 MSK)

Ответ на: комментарий от proDOOMman 12.03.11 15:52:18 MSK

>А у JavaDjVu никаких телодвижений нет.Закономерно

fix )

~~pylin~~ ★★★★★
(12.03.11 15:54:53 MSK)

Ссылка

Не понять мне, зачем использовать для текста алгоритм сжатия, который превращает его в нечитабельную рванину. Несколько раз сталкивался с литературой в djvu. После мучительных попыток это читать, я находил другие источники.

Axon ★★★★★
(12.03.11 16:08:47 MSK)

Ответ на: комментарий от Axon 12.03.11 16:08:47 MSK

зачем использовать для текста алгоритм сжатия

Почитай на русской вики, если не на сайте проекта, хотя бы, что и как и зачем сжимается.

В отсканированном изображении текста изначально нет, его надо распознать и вручную добавить в OCR слой. Если, например, книга была отсканирована криво («горизонт» завален), то строки текста в OCR слое могут не всегда совпадать по местоположению с изображениями этих символов в «маске», которая и содержит изображение текста и прочие чёткие детали. Я молчу о том, насколько качественным может этот OCR слой быть.

Обычно в DjVu оцифровывают старые книги с пожелтевшими страницами матрицы или диапзотивы которых найти невозможно. Когда такая книга срочно нужна и нет возможности взять бумажную, DjVu'шка даже просто из картинок по 150-300dpi сильно выручает. А для относительно свежих документов да, можно порой найти исходники в pdf или doc или ещё там в чём.
В этом я с тобой согласен - у меня нужные методички универские в электронной версии от автора(препода), а не отсканированные/отфотканные на перемене в библиотеке и загнанные в DjVu.

~~adriano32~~ ★★★
(12.03.11 16:22:43 MSK) автор топика

Ответ на: комментарий от adriano32 12.03.11 16:22:43 MSK

Я знаю, что сжимается изображение, но формат предназначен для хранения отсканированного текста. С этих изображений предполагается именно читать текст. И делать это после сжатия в djvu становится крайне неприятно. Лично я, например, лучше буду хранить на диске 150 мегабайт несжатых чёрно-белых сканов, чем 15 мегабайт djvu.

Axon ★★★★★
(12.03.11 16:43:23 MSK)

Ответ на: комментарий от Axon 12.03.11 16:43:23 MSK

xsane + scantailor + djvulibre дает отличные результаты. При хорошем качестве сканов степень сжатия достигает 100 раз, потери качества практически отсутвуют.

anonymous
(12.03.11 16:52:40 MSK)

Evince наше всё.

Dmitry_Sokolowsky ★★★★★
(12.03.11 17:23:53 MSK)

Современный pdf (>1.4) повкуснее djvu, при больших возможностях для работы с текстовым слоем, масками, векторными элементами и приблизительно эквивалентными (jpeg2000 ~ IW44, jbig2 ~ jb2, кодеки для потока по параметрам сжатия соизмеримы с zcoder).

Но это хорошо, что djvulibre продолжает развиваться.

nikitos ★★★
(12.03.11 17:33:19 MSK)

Ответ на: комментарий от anonymous 12.03.11 16:52:40 MSK

xsane + scantailor + djvulibre дает отличные результаты.

~~Sociopsih~~ ★☆
(12.03.11 17:35:59 MSK)

Ссылка

Ответ на: комментарий от nikitos 12.03.11 17:33:19 MSK

Современный (да и вообще любой) pdf не нужен. Нужен fb2 (или подобный ему) как основной «текстовый» формат, и djvu как «временный нетекстовый» - для хранения контента, который оцифровали, но еще не распознали. То что djvulibre продолжает развиваться - отличная новость, надо будет найти время и внести туда пару изменений для частичного рендеринга страниц в условиях малых объемов оперативки (для мобильных устройств)...

anonymous
(12.03.11 17:39:57 MSK)

Ответ на: комментарий от timur_dav 11.03.11 09:30:07 MSK

Да и в основном для сканированного ворованного контента.

1. Копирование != воровство. Это слух, пущенный капиталистическими недобитками, мучающимися в агонии и не знающими как же им теперь тянуть сверхприбыли из народа. 2. Компакт-диски и флешки тоже используются. Может не будем их покупать и поддерживать «пиратов»? ) Да что там мелочиться: винты и компьютеры нужно отнести на свалку.

~~Sociopsih~~ ★☆
(12.03.11 17:44:47 MSK)

Ответ на: комментарий от anonymous 12.03.11 17:39:57 MSK

TeX «замечательнее» fb2 ;) А по поводу ненужности pdf - какой векторный формат может его заменить?

nikitos ★★★
(12.03.11 17:44:48 MSK)

Ссылка

Ответ на: комментарий от Sociopsih 12.03.11 17:44:47 MSK

Копирование не воровство, а зачастую запрещённое правообладателями действие. Запрещённое без письменного разрешения.

nikitos ★★★
(12.03.11 17:46:36 MSK)

Ответ на: комментарий от Dmitry_Sokolowsky 12.03.11 17:23:53 MSK

Уважаемый Дмитрий, возможно, вы будете удивлены, но Evince «умеет» DjVu именно благодаря DjVuLibre.
Впрочем как и «умеет» pdf благодаря poppler - fork'y xpdf (ЕМНИП с использованием Qt).

Да будет больше годных утилит и вьюеров под linux!

~~adriano32~~ ★★★
(12.03.11 17:47:55 MSK) автор топика

Ссылка

Ответ на: комментарий от nikitos 12.03.11 17:46:36 MSK

Строгость и тупость российских законов компенсируется необязательностью их исполнения. А имеет ли смысл закон, который не выполняется большинством населения планеты? )

~~Sociopsih~~ ★☆
(12.03.11 17:53:12 MSK)

Ответ на: комментарий от NK 11.03.11 17:45:43 MSK

хорошая программа на Qt, рекомендую;

не всем хорошая. Многих очень нужных вещей нет

~~unanonymous~~
(12.03.11 18:02:46 MSK)

Ссылка

Ответ на: комментарий от Sociopsih 12.03.11 17:53:12 MSK

Уже можно спокойно загонять в DjVu книжки издательства ранее чем 1941 года. Чем пользуются мировые электронные библиотеки

Проблема копирайта на сравнительно давно изданную книгу решается письменным разрешением автора. Если автор ЗБ, то конечно он не даст свои книги сканить. Если адекват, то почему бы и нет?

O'Reilly+Safari Books ИМХО неплохая штука. Хочешь электронную версию вместо бумажной свежеизданной книги - плати, иначе превращать издательскую отрасль в исключительно дело добровольцев (бесплатно написал, бесплатно опубликовал, бесплатно издал) - неразумно. Все хотят кушать и хорошо жить, а написание даже мелкого хауту отбирает немало времени от основного занятия.

~~adriano32~~ ★★★
(12.03.11 18:03:06 MSK) автор топика

Ответ на: комментарий от adriano32 12.03.11 18:03:06 MSK

А существует какая-либо действительно хорошая электронная библиотека со свободно-распространяемыми книгами (т.е. которая гарантирует, что документ не был украден и не нарушает авторских прав)?

~~Stolzium~~
(12.03.11 18:18:44 MSK)

Ответ на: комментарий от adriano32 12.03.11 18:03:06 MSK

Уже можно спокойно загонять в DjVu книжки издательства ранее чем 1941 года.

ИМХО срок действия авторского права после смерти автора следует сократить раз в семь. И да, все изданное в СССР правообладателей иметь вообще не может, поскольку создавалось большей частью по заказу государства и/или оплачивалось им же. В целом, сейчас ситуация действительно выглядит более-менее пристойно. Даже несмотря на действия РАО, Михалкова и прочих «умников».

~~Sociopsih~~ ★☆
(12.03.11 18:19:15 MSK)

Ссылка

копирайт на книги, my ass

Каждый, кто считает, что следует соблюдать копирайт на книги - выродок, в мозгах у него черви, и должен быть уничтожен.

anonymous
(12.03.11 18:33:09 MSK)

Ссылка

Сделали бы вместо qt-шного просмотрщика что-нибудь типа mupdf.

buddhist ★★★★★
(12.03.11 18:48:00 MSK)

Ссылка

В свете последних событий, радует, что хороший софт на Qt все еще выходит

Ichiro ★
(12.03.11 18:54:37 MSK)

Ссылка

Ответ на: комментарий от anonymous 12.03.11 16:52:40 MSK

xsane + scantailor + djvulibre дает отличные результаты.

Может быть. Как бы донести это до всех, кто имеет дело с djvu... Печальная действительность в том, что абсолютно все книги в dvju, что я видел, были нечитаемы.

Axon ★★★★★
(12.03.11 19:23:39 MSK)

Ответ на: комментарий от timur_dav 11.03.11 09:30:07 MSK

> А мог бы и jpeg потеснить сильно.

+1024

shahid ★★★★★
(12.03.11 19:40:56 MSK)

Хороший, годный просмотрщик.

Nebuchadnezzar ★★★★
(12.03.11 20:22:56 MSK)

Ссылка

Ответ на: комментарий от Axon 12.03.11 19:23:39 MSK

Да. Бывает. Некоторые «умники» их даже в чб не переводят, а просто тупо преобразуют в djvu сырые сканы. ( Вот за такое надо руки отрывать.

~~Sociopsih~~ ★☆
(12.03.11 20:26:03 MSK)

Ссылка

Ответ на: комментарий от shahid 12.03.11 19:40:56 MSK

Уже не актуально. Есть WebP.

~~Sociopsih~~ ★☆
(12.03.11 20:27:23 MSK)

Ссылка

для смотрелки окуляр ИМХО лучше.

кстати, по-моему DJVU читалка есть под дос. её надо обновить

luke ★★★★★
(12.03.11 21:34:30 MSK)

Ответ на: комментарий от luke 12.03.11 21:34:30 MSK

Okular поддерживает следующие форматы файлов:

* PDF с помощью Poppler
* PostScript с помощью libgs
* TIFF с помощью libTIFF
* HTMLHelp (CHM) с помощью libCHM
* DjVu с помощью DjVuLibre
* DVI (TeX)
* XPS
* OpenDocument (ODF)
* FictionBook
* ComicBook (англ.) (например CBR)
* Plucker
* JPEG, PNG, GIF и ряд других растровых форматов
(c) Википедия.

~~Sociopsih~~ ★☆
(12.03.11 21:44:39 MSK)

Ответ на: комментарий от Sociopsih 12.03.11 21:44:39 MSK

ну так я имел в виду смотрелку. она кошернее, чем djvuview

luke ★★★★★
(12.03.11 21:47:52 MSK)

Ответ на: комментарий от luke 12.03.11 21:47:52 MSK

Точно. Прошу прощения. Но все равно не юникс вэй. )

~~Sociopsih~~ ★☆
(12.03.11 21:51:08 MSK)

Ответ на: комментарий от Axon 12.03.11 19:23:39 MSK

Может быть. Как бы донести это до всех, кто имеет дело с djvu... Печальная действительность в том, что абсолютно все книги в dvju, что я видел, были нечитаемы.

Что же тебе за книги-то попадали? Если исходное разрешение сканов было нормальным, то после обработки большинства DjVu-инструментов, ты получаешь хороший результат. Приемлемый не только для чтения, но и для распознавания текста, что намного более требовательно.

AlexVR ★★★★★
(12.03.11 21:52:25 MSK)

Ответ на: комментарий от Sociopsih 12.03.11 21:51:08 MSK

linux тоже не unix-way

luke ★★★★★
(12.03.11 21:53:06 MSK)

Ссылка

Ответ на: комментарий от luke 12.03.11 21:47:52 MSK

Sociopsih, я думаю как и я в споре с Dmitry_Sokolowsky по поводу Evince, имел в виду, что юзать DjView4 более Ъ, так как остальные просмотрщики используют всё равно код DjVuLibre.

~~adriano32~~ ★★★
(12.03.11 21:53:31 MSK) автор топика

Ссылка

Ответ на: комментарий от luke 12.03.11 21:34:30 MSK

для смотрелки окуляр ИМХО лучше.

мне так наоборот сабж больше всего нравится.

AlexVR ★★★★★
(12.03.11 21:54:39 MSK)

Ответ на: комментарий от AlexVR 12.03.11 21:54:39 MSK

ну дык дело привычки. мне нравится, когда все книги открываются в одной программе

luke ★★★★★
(12.03.11 21:56:43 MSK)

Ссылка

Ответ на: комментарий от Dmitry_Sokolowsky 12.03.11 17:23:53 MSK

Был-бы, если бы не попплер.

Boboms ★★
(12.03.11 22:59:01 MSK)

Ссылка

Ответ на: комментарий от adriano32 12.03.11 16:22:43 MSK

>В этом я с тобой согласен - у меня нужные методички универские в электронной версии от автора(препода), а не отсканированные/отфотканные на перемене в библиотеке и загнанные в DjVu.

Несмотря на то что на дворе 21й век, все-еще попадаются какие-то закопиращенные методички (или их авторы) и сейчас, и приходится порой юзать сканы. Sad, but true.

За новость спасибо, программа хорошая.

onix_N ★★
(12.03.11 23:55:34 MSK)

Ссылка

Ответ на: комментарий от AlexVR 12.03.11 21:52:25 MSK

Что же тебе за книги-то попадали?

Вот, например: http://img808.imageshack.us/i/djvu.png/. Да, это вполне пригодно для распознавания текста, но при попытке читать такое, у меня вытекают глаза.

Axon ★★★★★
(13.03.11 00:51:35 MSK)

Ответ на: комментарий от nikitos 12.03.11 17:33:19 MSK

>Современный pdf (>1.4) повкуснее djvu

Но всё равно-же нечитаемое мыло во всех ридерах и огромный размер файла.

legolegs ★★★★★
(13.03.11 00:57:07 MSK)

Ссылка

Права на технологию-это патенты?

Права на технологию-это патенты? Тогда уж лучше PostScript/PDF. Технологии старые, проверенные. Отсканированные книги много весят, но зато срок действия патентов на старьё давно истёк, по идее. И то, что отсканированная книга в PDF весит больше, чем такая же в DJVU, не страшно.

lucentcode ★★★★★
(13.03.11 01:01:27 MSK)

Ответ на: комментарий от Axon 13.03.11 00:51:35 MSK

Вот от радуги в твоих шрифтах глаза и правда могут вытечь, а с дежавюшкой всё нормально. Хотя, кто-бы спорил, нормальный текст (html или ещё что) было-бы читать сильно приятнее.

legolegs ★★★★★
(13.03.11 01:01:31 MSK)