LINUX.ORG.RU
ФорумTalks

[жж][ненависть] DJVU

 ,


0

0

Какой нехороший человек придумал распространять книги в этом <censored> формате? Это же сплошное ШРИФТЫГОВНО! Уродские, мохнатые буквы, строки ни хрена не горизонтальные, поиска нет по причине отсутствия текста и наличия вместо него уродских мохнатых нарисованных букв. Сцуке! Это же невозможно читать! Ррррррр!

★★★★★

Нормальный такой формат.
Мне очень даже нравится.

trex6 ★★★★★
()

Ну это же просто сканированные изображения, а сам формат отличается очень мощным сжатием.

Уродские, мохнатые буквы, строки ни хрена не горизонтальные


Ну это от качества скана зависит.

Гораздо хуже, когда тоже самое запихивают в PDF на гигабайты...

anonymfus ★★★★
()
Ответ на: комментарий от anonymfus

Угу, только без этого формата у тебя не было бы 80% той литературы, что у тебя есть в коллекции. Ибо тенденции издавать книги и в электронном варианте особо не проглядываются (только в редких случаях).

ucalculus
()
Ответ на: комментарий от heilnull

Вот именно, вопрос в том, какого хрена вендузятнегу, делающесу этот скан, влом его распознать, проглядеть на предмет ошибок и сделать нормально читаемый PDF, а не это мохнатое нечто.

INFOMAN ★★★★★
() автор топика
Ответ на: комментарий от INFOMAN

Как тебя сказать. DjVu не всегда уныло. Есть очень и очень хорошие сканы. Тут все зависит от умения и навыков сканировщика и самого сканера. Лично я не признаю сканов, которые были РАСПОЗНАНЫ кем-либо до этого, ибо это исключает аутентичность материалов. Скан же дает 100% гарантию. +фактор времени. Пока распознаешь — поседеешь.

ucalculus
()
Ответ на: комментарий от INFOMAN

> влом его распознать, проглядеть на предмет ошибок

Ты готов оплатить эту _работу_?

Manhunt ★★★★★
()
Ответ на: комментарий от INFOMAN

Вот именно, вопрос в том, какого хрена вендузятнегу, делающесу этот скан, влом его распознать, проглядеть на предмет ошибок и сделать нормально читаемый PDF, а не это мохнатое нечто.

Вот за такое надо убивать. Банально. После, так называемого распознавания, вместо нормального djvu метров на 5-8, получается совершенно нечитаемое pdf-.овно метров на 100.

a3
()

DJVU всегда меньше по размеру. И когда стоит выбор, скачать ли мне книгу в djvu в 12 мегабайт или в pdf в 66 мегабайт, при этом оба варианта в одинаковом качестве, то я даже как-то не задумываюсь.

slyjoe
()
Ответ на: комментарий от INFOMAN

Угу. Еще сменить шрифт на Comic Sans MS и сделать в ворде PDF, чтобы потом, при открытии этого монстра, читателю захотелось убить дебила, который сканировал.

И еще все djvu ридеры, которые мне попадались работают очень шустро, чего не скажешь о PDF-читалках.

DerKetzer
()
Ответ на: комментарий от INFOMAN

> влом его распознать, проглядеть на предмет ошибок и сделать нормально читаемый PDF

А вы сами давно это делали в последний раз? FineReader отнюдь не бесплатный, а всё остальное абсолютное говно по сравнению с ним, и при этом даже для хорошо отсканированной книги несколько ошибок распознавания на страницу остаются нормой, и, учитывая, что не все FineReader подсвечивает как сомнительные места, то перечитывание является каторжным трудом.

anonymfus ★★★★
()
Ответ на: комментарий от INFOMAN

> Вот именно, вопрос в том, какого хрена вендузятнегу, делающесу этот скан, влом его распознать, проглядеть на предмет ошибок и сделать нормально читаемый PDF, а не это мохнатое нечто.

От этого виндоузятника хотябы видна реальная польза в виде отсканированной книги, а от вас пользы - никакой.

Deleted
()

> поиска нет по причине отсутствия текста

Формат Djvu поддерживает текстовый слой, только его не всегда вставляют. Но если он есть, то для книг с формулами очень удобно, весь вид внешне сохраняется, но есть ещё возможность поиска.

anonymous_incognito ★★★★★
()

> ШРИФТЫГОВНО! Уродские, мохнатые буквы, строки ни хрена не горизонтальные

facepalm.djvu
Плохому танцору и ноги мешают.

DjVu ориентирован на сохранение сканов.

Если сканировщик был под наркотиками, у него тряслись руки, а в сканере наполовину заедали моторчики, то только электрический стул спасет.

поиска нет по причине отсутствия текста


Формат djvu разрешает накладывать текст на скан как раз для этих целей. Просто никто этого не делает по понятным причинам. Опять таки претензии к сканировщику.

Кстати, рекомендую покурить доки по c44 и cjb2. Первый позволяет перегонять фотки в djvu с уменьшением размера в разы.

shahid ★★★★★
()

мосье знает, что там, как правило, сканы?

demidrol ★★★★★
()
Ответ на: комментарий от INFOMAN

Цитируем INFOMAN

влом его распознать

кстати, а есть распознавалки, которые из скана делают тех-файл (формулы там, диаграммы)? Ну, не все же худ. литературу сканить.

demidrol ★★★★★
()

У меня кстати поиск работает в djview, причём и по русски, был удивлён, в него OCR чтоли встроили, или при создании файла распознали и засунули текст вместе со сканами?

CrazyPit ★★★
()
Ответ на: комментарий от anonymfus

> FineReader отнюдь не бесплатный

У них всё равно в большинстве случаев куча пиратского говна стоит, что мешает добавить ещё одну маленькую кучку?

INFOMAN ★★★★★
() автор топика
Ответ на: комментарий от Deleted

> польза в виде отсканированной книги

Которую невозможно читать, не сломав глаза об мохнатые буквы.

INFOMAN ★★★★★
() автор топика
Ответ на: комментарий от platerx

> распознать кингу

Теперь ЭТО называется «распознать»?

INFOMAN ★★★★★
() автор топика
Ответ на: комментарий от INFOMAN

>какого хрена вендузятнегу, делающесу этот скан, влом его распознать

если осилишь отсканировать справочник на 900 страниц с кучей формул, таблиц и чертежей, а потом еще и распознать без единой ошибки - поставлю памятник. Правда, скорее всего получится только посмертный.

nu11 ★★★★★
()

>Уродские, мохнатые буквы
про текстовый слой тебе уже несколько раз сказали. А скан скану рознь, у меня есть книжка, отсканированная на 600dpi. Шрифты как в оригинале :0

nu11 ★★★★★
()
Ответ на: комментарий от DerKetzer

> djvu ридеры... работают очень шустро

Работают-то шустро, но с мохнатыми буквами сделать ничего нельзя.

Или таки есть какой-то способ?

INFOMAN ★★★★★
() автор топика
Ответ на: комментарий от INFOMAN

это — да, распознать художественную литературу тем же cuneiform'ом — вообще одно удовольствие. Речь про теорфиз, например. Вообще, возьмите любой PhysRev. ШГ еще то, но содержание же важнее?

demidrol ★★★★★
()
Ответ на: комментарий от INFOMAN

скажи честно, с какой целью ты создал этот [s]высе[/s] пост? Не хватает троллинга в толксах? Чем тебе помешал этот прекрасный формат?

nu11 ★★★★★
()

Недавно распечатывал K&R в формате DJVU. Вполне нормальный формат, фактически тот же PDF. Текст присутствует, есть даже букмарки.

Не ругайте тапочки, ругайте тех кто танцует.

bbk123 ★★★★★
()
Ответ на: комментарий от bbk123

А я вот скачал «Искусство программирования для UNIX» в надежде вкурить Дзен и постигнуть Дао, а вместо этого приходится ломать глаза.

Если есть где-то вариант с немохнатыми буквами, буду благодарен за ссылку.

INFOMAN ★★★★★
() автор топика
Ответ на: комментарий от INFOMAN

Я думаю ты гораздо больше ругался бы если то что ты скачал было криво распознано, с убитым форматированиемб с кучей ошибок, и в виде doc файла.

platerx
()
Ответ на: комментарий от INFOMAN

>Формат-то, может, и прекрасный

именно. И он тут ни при чем.

nu11 ★★★★★
()

3х звездочный тролль. Ниасилил DJVU. Таким не место в линуксе, иди дальше читай книжки в DOC.

daemonpnz ★★★★★
()
Ответ на: комментарий от INFOMAN

>приходится ломать глаза.
купи ж наконец книгу.

ЗЫ: хотя Дзен ты всё равно по ней не постигнешь)

xydo ★★
()

Еще никто не предложил выпить портвейна и погонять лысого.

Zodd ★★★★★
()
Ответ на: комментарий от demidrol

>кстати, а есть распознавалки, которые из скана делают тех-файл (формулы там, диаграммы)? Ну, не все же худ. литературу сканить.

дядь, искуственный разум ещё не изобрели

timth ★☆
()
Ответ на: комментарий от INFOMAN

Разрешаю пофиксить баги. Наберёшь несколько страниц формул со сложным форматированием - вопросы по поводу оправданности DJVU - формата отпадут.

aiqu6Ait ★★★★
()
Ответ на: комментарий от demidrol

>кстати, а есть распознавалки, которые из скана делают тех-файл (формулы там, диаграммы)? Ну, не все же худ. литературу сканить.

Есть. Только они довольно дорогие и требуют ухода - питание, сон, освещение рабочего места и пр.

aiqu6Ait ★★★★
()

многие хорошие книджки даже в библиотеке не найдёшь. только колхоз спасает да.

timth ★☆
()
Ответ на: комментарий от INFOMAN

Потому что это большая и сложная работа. Голый текст-то можно распознать, а вот открой-ка справочник какой-нибудь типа Анурьева, и попробуй его осилить, со всеми таблицами и схемами.

MadCAD ★★
()

Ну и не читай, разве не понятно?

В большинстве случаев лучше иметь djvu, чем не иметь ничего, или иметь скан пропущенный через фришный OCR, который действительно становится невозможно читать, — смотришь порой на текст, и пытаешься понять, а что же там могло на самом деле быть?.. Не говоря уже о полном несоответсвии иллюстраций, формул, итп, исходным позициям в тексте. А уж если OCR формулы «распознает» (как текст), и никто это не проверит ручками, и не исправит, так это вообще пистец.

a2
()

Вообще лол, человек возмущается что ему достался краденный товар в плохом качестве =) Краденный потому что авторы отсканенной книги врядли давали добро на её сканирование =)

Deleted
()
Ответ на: комментарий от Ramen

Оригинал вообще под -nd, но вероятно, переводчеги отдельно о лицензии договаривались.

INFOMAN ★★★★★
() автор топика

+пиццоттысяч. в 21 веке живём.

robot12 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.