LINUX.ORG.RU
ФорумTalks

[жж][ненависть] DJVU

 ,


0

0

Какой нехороший человек придумал распространять книги в этом <censored> формате? Это же сплошное ШРИФТЫГОВНО! Уродские, мохнатые буквы, строки ни хрена не горизонтальные, поиска нет по причине отсутствия текста и наличия вместо него уродских мохнатых нарисованных букв. Сцуке! Это же невозможно читать! Ррррррр!

★★★★★

Ответ на: комментарий от anonymous20090302

для Ъ:

DjVu (от фр. déjà vu — «уже виденное») — технология сжатия изображений с потерями, разработанная специально для хранения сканированных документов — книг, журналов, рукописей и прочее, где обилие формул, схем, рисунков и рукописных символов делает чрезвычайно трудоёмким их полноценное распознавание. Также является эффективным решением, если необходимо передать все нюансы оформления, например, исторических документов, где важное значение имеет не только содержание, но и цвет и фактура бумаги; дефекты пергамента: трещинки, следы от складывания; исправления, кляксы, отпечатки пальцев; следы, оставленные другими предметами.

anonymous20090302
()
Ответ на: комментарий от anonymous20090302

А если мне нафиг не нужны кляксы, отпечатки пальцев и прочие мохнатости, а только буквы и сопутствующие им символы?

INFOMAN ★★★★★
() автор топика

В чем проблема, распознай и выложи в odt...

Harliff ★★★★★
()

После того, как я полистаю старые «Юные техники» в дежавю, мне любые настройки любых шрифтов кажутся идеальными.

abraziv_whiskey ★★★★★
()
Ответ на: комментарий от robot12

не глупи, кто будет эти буквы набирать? читать то не все ли равно с какого формата?

bioreactor ★★★★★
()
Ответ на: комментарий от INFOMAN

Сходи в магазин, купи эту книжку и наслаждайся. Это самое лучшее, что ты можешь сделать с «мохнатыми буквами»

gizzka ★★
()

>>INFOMAN

robot12

А вы, яйцеголовики, хоть одну книжечку отсканили и выложили в общий доступ, чтоб претензии иметь к распознавателям? Нет?

Судя по всему, оба еще и гуманитарии, ибо с проблемой формул не знакомы.

На либру, читать паолэкаэлио в plaintext koi-8, быдло!

mclaudt
()

>Это же сплошное ШРИФТЫГОВНО! Уродские, мохнатые буквы, строки ни хрена не горизонтальные

JPEG и PNG - тоже уродские?

DjVu - это графический, а не текстовый формат. Да, со своими мульками, но - графический. Растровый.

Сцуке! Это же невозможно читать!


Значит, таким был оригинал. DjVu разрабатывался для эффективного сохранения сканированных оригиналов. Рукописи, там, всякие и т.п.

KRoN73 ★★★★★
()
Ответ на: комментарий от CrazyPit

>или при создании файла распознали и засунули текст вместе со сканами?

Да. DjVu поддерживает параллельный с изображением текст. Но это - нужно распознавать. И это - уже вторично. Только для удобства. DjVu делался как формат, заточенный под сохранение всяких рукописей.

KRoN73 ★★★★★
()
Ответ на: комментарий от abraziv_whiskey

>После того, как я полистаю старые «Юные техники» в дежавю, мне любые настройки любых шрифтов кажутся идеальными.

Ага. Я когда djvu-шки «Техники молодёжи» впервые увидел, подумал, что у кого-то сканер страшно барахлил. Фигушки, такая печать тогда была :)

KRoN73 ★★★★★
()
Ответ на: комментарий от KRoN73

> DjVu - это графический, а не текстовый формат

Вот я и спрашиваю, какого фига в графическом формате хранится чисто текстовая инфа, для которой вполне хватило бы форматирования уровня fb2?

INFOMAN ★★★★★
() автор топика
Ответ на: комментарий от shahid

>Просто никто этого не делает по понятным причинам. Опять таки претензии к сканировщику.

Ага и приходится самому ocr слой делать ибо поиск иногда очень критичен, к тому же в okular, например, с распознанным дежавю можно делать очень много полезных вещей, таких как выделение текста, комментарии и т.д.

petrosyan ★★★★★
()
Ответ на: комментарий от INFOMAN

Вот я и спрашиваю, какого фига в графическом формате хранится чисто текстовая инфа, для которой вполне хватило бы форматирования уровня fb2?

Ты че такой дерский-то? Возьми сам набей ручками и выложи в открытый доступ, если такой «умный». Смотри наглец, люди отсканировали и бесплатно ему отдали, а он еще и недоволен!

a3
()
Ответ на: комментарий от a3

Этот - читабелен, и глаза об него не ломаются. Если бы так сканировали все, этой темы бы, скорее всего, не было.

INFOMAN ★★★★★
() автор топика
Ответ на: комментарий от INFOMAN

>Вот именно, вопрос в том, какого хрена вендузятнегу, делающесу этот скан, влом его распознать, проглядеть на предмет ошибок и сделать нормально читаемый PDF, а не это мохнатое нечто.

Ну вот возьми этот djvu, перегони обратно в картинки, распознай, вычитай и сделай нормально читаемый pdf. Что тебе мешает?

dn2010 ★★★★★
()
Ответ на: комментарий от dn2010

эээ, ну я, конечно, могу попытаться, но сомневаюсь, что мохнатые русские буквы понравятся куниформусу или тессеракту.

INFOMAN ★★★★★
() автор топика
Ответ на: комментарий от INFOMAN

>эээ, ну я, конечно, могу попытаться, но сомневаюсь, что мохнатые русские буквы понравятся куниформусу или тессеракту.

Ну сделай их немохнатыми перед тем, как засовывать. Всё равно у тебя в djvu практически копия того, что насканировано было.

dn2010 ★★★★★
()
Ответ на: комментарий от INFOMAN

>Которую невозможно читать, не сломав глаза об мохнатые буквы.

У виндузятников есть опция антиалиасинга дежавюшек. Чаще всего получается нормально, но на некоторых файлах бывает мыло. В линкусовых вьюверах не встречал. Как вариант решения проблемы - попробовать менять масштаб, чаще всего находится какой-то масштаб, на котором этот скан смотрится приятней, чем на 100 % или выровненный по ширине.

petrosyan ★★★★★
()
Ответ на: комментарий от INFOMAN

>А если мне нафиг не нужны кляксы, отпечатки пальцев и прочие мохнатости, а только буквы и сопутствующие им символы?

хм... ну не пользуйся значит дежавю-файлами, в чем проблема?

попробуй разные просмотрщики, в том числе вендовые под вайном, чтоле.

anonymous20090302
()

djvu - формат графических файлов. Угадай, что там распространяют. Хотя есть извращенцы которые сканируют в pdf, так там еще артефакты сжатия добавляются

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от INFOMAN

>Вот я и спрашиваю, какого фига в графическом формате хранится чисто текстовая инфа, для которой вполне хватило бы форматирования уровня fb2?

Ну так перенабери в fb2, в чем проблема? Ты сам-то книжку сканировал? Даже если ловко перебирать пальцами как обезьяна а сканирование запускается автоматически это все равно минимум полминуты на страницу, итого часа три только на сам процесс. А еще проверка, исправление, подрезка полей... Я сам отсканировал штук 10 книжек, все, хватит...

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от INFOMAN

Ну так ищешь оригинал и сканируешь сам. У меня сканы неплохие получались но не у всех же прямые руки. Некоторым допустим лень пересканировать если страница сдвинулась. Но все-равно человек потратил свое личное время чтоб ты мог читать книжку. А человеческий труд надо уважать, мало у кого хватает терпения на сканирование

DNA_Seq ★★☆☆☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.