LINUX.ORG.RU

DjVuLibre 3.5.24 и DjView4 4.7

 , , , ,


0

1

Тихо и незаметно 6 марта вышла обновлённая версия набора утилит для работы с файлами в формате DjVu — DjVuLibre 3.5.24, в том числе версия 4.7 просмотрщика файлов в формате DjVu — DjView4, целиком написанного на Qt4.

DjVuLibre это открытый проект по разработке компрессора изображений в формат DjVu, сборщика DjVu-файлов, ряда утилит для манипуляций с файлами данного формата, просмотрщика для X11, а также ряда конвертеров в другие открытые форматы. Кроме вышеперечисленного в состав DjVuLibre входит плагин для просмотра DjVu-файлов в браузерах Netscape-4.x, Netscape-6.x, Mozilla, Galeon, Konqueror и Opera.

Напомним, что DjVu — открытая технология и формат файла, предназначенный для сжатия с потерями чёрно-белых и цветных изображений с возможностью добавления в полученный документ текстового (OCR) слоя и ссылок. При сжатии используются алгоритм IW44, основанный на вейвлет-преобразовании, и алгоритм JB2, подобный JBIG2.

Технология, применяемая для сжатия изображений в DjVu, была разработана AT&T Labs в 1996, в данный момент права на технологию принадлежат компании Caminova.

Исходный код DjVuLibre

Исходный код DjView4

О технологии

>>> Подробности

★★★

Проверено: mono ()

Кошерный формат. Жаль, мало используется. Да и в основном для сканированного ворованного контента. А мог бы и jpeg потеснить сильно.

timur_dav ☆☆☆☆☆ ()

Что-то я чейнджлог нигде не вижу.

petrosyan ★★★★★ ()
Ответ на: комментарий от petrosyan

Именно в тарболах :)

Для Ъ выкладываю, несмотря на то, что сию же минуту посыпятся голоса «минорщина»:

DjVuLibre
NEW IN VERSION 3.5.24
---------------------
- Set ddjvuapi_version to 20.
- Added ddjvuapi support for changing the white point.
- Added option "-u" in djvused.
- Added option "-o djvufile" in djvuxmlparser.
- Added support for <CHARACTER> tag in djvuxmlparser.
- Added print-xmp, set-xmp, remove-smp in djvused.

DjView4
NEW IN VERSION 4.7
--------------------
- Fix for crash on quick PgUp PgDn sequences.
- Fix scrollbars in continuous mode.
- Fix plugin for some webkit based browsers.

adriano32 ★★★ ()

хорошая программа на Qt, рекомендую;
вот бы что-то подобное, но для pdf найти... если кто знает - поделитесь инфой

NK ★★★★★ ()

А у JavaDjVu никаких телодвижений нет. Печально

proDOOMman ★★ ()
Ответ на: комментарий от proDOOMman

>А у JavaDjVu никаких телодвижений нет.Закономерно

fix )

pylin ★★★★★ ()

Не понять мне, зачем использовать для текста алгоритм сжатия, который превращает его в нечитабельную рванину. Несколько раз сталкивался с литературой в djvu. После мучительных попыток это читать, я находил другие источники.

Axon ★★★★★ ()
Ответ на: комментарий от Axon

зачем использовать для текста алгоритм сжатия

Почитай на русской вики, если не на сайте проекта, хотя бы, что и как и зачем сжимается.

В отсканированном изображении текста изначально нет, его надо распознать и вручную добавить в OCR слой. Если, например, книга была отсканирована криво («горизонт» завален), то строки текста в OCR слое могут не всегда совпадать по местоположению с изображениями этих символов в «маске», которая и содержит изображение текста и прочие чёткие детали. Я молчу о том, насколько качественным может этот OCR слой быть.

Обычно в DjVu оцифровывают старые книги с пожелтевшими страницами матрицы или диапзотивы которых найти невозможно. Когда такая книга срочно нужна и нет возможности взять бумажную, DjVu'шка даже просто из картинок по 150-300dpi сильно выручает. А для относительно свежих документов да, можно порой найти исходники в pdf или doc или ещё там в чём.
В этом я с тобой согласен - у меня нужные методички универские в электронной версии от автора(препода), а не отсканированные/отфотканные на перемене в библиотеке и загнанные в DjVu.

adriano32 ★★★ ()
Ответ на: комментарий от adriano32

Я знаю, что сжимается изображение, но формат предназначен для хранения отсканированного текста. С этих изображений предполагается именно читать текст. И делать это после сжатия в djvu становится крайне неприятно. Лично я, например, лучше буду хранить на диске 150 мегабайт несжатых чёрно-белых сканов, чем 15 мегабайт djvu.

Axon ★★★★★ ()
Ответ на: комментарий от Axon

xsane + scantailor + djvulibre дает отличные результаты. При хорошем качестве сканов степень сжатия достигает 100 раз, потери качества практически отсутвуют.

anonymous ()

Современный pdf (>1.4) повкуснее djvu, при больших возможностях для работы с текстовым слоем, масками, векторными элементами и приблизительно эквивалентными (jpeg2000 ~ IW44, jbig2 ~ jb2, кодеки для потока по параметрам сжатия соизмеримы с zcoder).

Но это хорошо, что djvulibre продолжает развиваться.

nikitos ★★ ()
Ответ на: комментарий от nikitos

Современный (да и вообще любой) pdf не нужен. Нужен fb2 (или подобный ему) как основной «текстовый» формат, и djvu как «временный нетекстовый» - для хранения контента, который оцифровали, но еще не распознали. То что djvulibre продолжает развиваться - отличная новость, надо будет найти время и внести туда пару изменений для частичного рендеринга страниц в условиях малых объемов оперативки (для мобильных устройств)...

anonymous ()
Ответ на: комментарий от timur_dav

Да и в основном для сканированного ворованного контента.

1. Копирование != воровство. Это слух, пущенный капиталистическими недобитками, мучающимися в агонии и не знающими как же им теперь тянуть сверхприбыли из народа. 2. Компакт-диски и флешки тоже используются. Может не будем их покупать и поддерживать «пиратов»? ) Да что там мелочиться: винты и компьютеры нужно отнести на свалку.

Sociopsih ★☆ ()
Ответ на: комментарий от anonymous

TeX «замечательнее» fb2 ;) А по поводу ненужности pdf - какой векторный формат может его заменить?

nikitos ★★ ()
Ответ на: комментарий от Sociopsih

Копирование не воровство, а зачастую запрещённое правообладателями действие. Запрещённое без письменного разрешения.

nikitos ★★ ()
Ответ на: комментарий от Dmitry_Sokolowsky

Уважаемый Дмитрий, возможно, вы будете удивлены, но Evince «умеет» DjVu именно благодаря DjVuLibre.
Впрочем как и «умеет» pdf благодаря poppler - fork'y xpdf (ЕМНИП с использованием Qt).

Да будет больше годных утилит и вьюеров под linux!

adriano32 ★★★ ()
Ответ на: комментарий от nikitos

Строгость и тупость российских законов компенсируется необязательностью их исполнения. А имеет ли смысл закон, который не выполняется большинством населения планеты? )

Sociopsih ★☆ ()
Ответ на: комментарий от NK

хорошая программа на Qt, рекомендую;

не всем хорошая. Многих очень нужных вещей нет

unanonymous ()
Ответ на: комментарий от Sociopsih

Уже можно спокойно загонять в DjVu книжки издательства ранее чем 1941 года. Чем пользуются мировые электронные библиотеки

Проблема копирайта на сравнительно давно изданную книгу решается письменным разрешением автора. Если автор ЗБ, то конечно он не даст свои книги сканить. Если адекват, то почему бы и нет?

O'Reilly+Safari Books ИМХО неплохая штука. Хочешь электронную версию вместо бумажной свежеизданной книги - плати, иначе превращать издательскую отрасль в исключительно дело добровольцев (бесплатно написал, бесплатно опубликовал, бесплатно издал) - неразумно. Все хотят кушать и хорошо жить, а написание даже мелкого хауту отбирает немало времени от основного занятия.

adriano32 ★★★ ()
Ответ на: комментарий от adriano32

А существует какая-либо действительно хорошая электронная библиотека со свободно-распространяемыми книгами (т.е. которая гарантирует, что документ не был украден и не нарушает авторских прав)?

Stolzium ()
Ответ на: комментарий от adriano32

Уже можно спокойно загонять в DjVu книжки издательства ранее чем 1941 года.

ИМХО срок действия авторского права после смерти автора следует сократить раз в семь. И да, все изданное в СССР правообладателей иметь вообще не может, поскольку создавалось большей частью по заказу государства и/или оплачивалось им же. В целом, сейчас ситуация действительно выглядит более-менее пристойно. Даже несмотря на действия РАО, Михалкова и прочих «умников».

Sociopsih ★☆ ()

копирайт на книги, my ass

Каждый, кто считает, что следует соблюдать копирайт на книги - выродок, в мозгах у него черви, и должен быть уничтожен.

anonymous ()

Сделали бы вместо qt-шного просмотрщика что-нибудь типа mupdf.

buddhist ★★★★★ ()

В свете последних событий, радует, что хороший софт на Qt все еще выходит

Ichiro ()
Ответ на: комментарий от anonymous

xsane + scantailor + djvulibre дает отличные результаты.

Может быть. Как бы донести это до всех, кто имеет дело с djvu... Печальная действительность в том, что абсолютно все книги в dvju, что я видел, были нечитаемы.

Axon ★★★★★ ()
Ответ на: комментарий от Axon

Да. Бывает. Некоторые «умники» их даже в чб не переводят, а просто тупо преобразуют в djvu сырые сканы. ( Вот за такое надо руки отрывать.

Sociopsih ★☆ ()

для смотрелки окуляр ИМХО лучше.

кстати, по-моему DJVU читалка есть под дос. её надо обновить

luke ★★★ ()
Ответ на: комментарий от luke

Okular поддерживает следующие форматы файлов:


* PDF с помощью Poppler
* PostScript с помощью libgs
* TIFF с помощью libTIFF
* HTMLHelp (CHM) с помощью libCHM
* DjVu с помощью DjVuLibre
* DVI (TeX)
* XPS
* OpenDocument (ODF)
* FictionBook
* ComicBook (англ.) (например CBR)
* Plucker
* JPEG, PNG, GIF и ряд других растровых форматов
(c) Википедия.

Sociopsih ★☆ ()
Ответ на: комментарий от Sociopsih

ну так я имел в виду смотрелку. она кошернее, чем djvuview

luke ★★★ ()
Ответ на: комментарий от Axon

Может быть. Как бы донести это до всех, кто имеет дело с djvu... Печальная действительность в том, что абсолютно все книги в dvju, что я видел, были нечитаемы.

Что же тебе за книги-то попадали? Если исходное разрешение сканов было нормальным, то после обработки большинства DjVu-инструментов, ты получаешь хороший результат. Приемлемый не только для чтения, но и для распознавания текста, что намного более требовательно.

AlexVR ★★★★★ ()
Ответ на: комментарий от luke

Sociopsih, я думаю как и я в споре с Dmitry_Sokolowsky по поводу Evince, имел в виду, что юзать DjView4 более Ъ, так как остальные просмотрщики используют всё равно код DjVuLibre.

adriano32 ★★★ ()
Ответ на: комментарий от luke

для смотрелки окуляр ИМХО лучше.

мне так наоборот сабж больше всего нравится.

AlexVR ★★★★★ ()
Ответ на: комментарий от AlexVR

ну дык дело привычки. мне нравится, когда все книги открываются в одной программе

luke ★★★ ()
Ответ на: комментарий от adriano32

>В этом я с тобой согласен - у меня нужные методички универские в электронной версии от автора(препода), а не отсканированные/отфотканные на перемене в библиотеке и загнанные в DjVu.

Несмотря на то что на дворе 21й век, все-еще попадаются какие-то закопиращенные методички (или их авторы) и сейчас, и приходится порой юзать сканы. Sad, but true.

За новость спасибо, программа хорошая.

onix_N ★★ ()
Ответ на: комментарий от AlexVR

Что же тебе за книги-то попадали?

Вот, например: http://img808.imageshack.us/i/djvu.png/. Да, это вполне пригодно для распознавания текста, но при попытке читать такое, у меня вытекают глаза.

Axon ★★★★★ ()
Ответ на: комментарий от nikitos

>Современный pdf (>1.4) повкуснее djvu

Но всё равно-же нечитаемое мыло во всех ридерах и огромный размер файла.

legolegs ★★★★★ ()

Права на технологию-это патенты?

Права на технологию-это патенты? Тогда уж лучше PostScript/PDF. Технологии старые, проверенные. Отсканированные книги много весят, но зато срок действия патентов на старьё давно истёк, по идее. И то, что отсканированная книга в PDF весит больше, чем такая же в DJVU, не страшно.

lucentcode ★★★★★ ()
Ответ на: комментарий от Axon

Вот от радуги в твоих шрифтах глаза и правда могут вытечь, а с дежавюшкой всё нормально. Хотя, кто-бы спорил, нормальный текст (html или ещё что) было-бы читать сильно приятнее.

legolegs ★★★★★ ()
Ответ на: комментарий от proDOOMman

> А у JavaDjVu никаких телодвижений нет. Печально

Если б кому-то нужно было, не забросили

eReSik ★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.