Ответ на: комментарий от system-root 20.12.17 22:14:32 MSK

наверное нужно разжевать для особо одарённых, вроде анона.
крупнейшее нелегальное собрание всех fb2 файлов находится именно в таком состоянии. рандомные теги в рандомных местах. это невозможно распарсить, скажем в БД, используя «спецификацию» fb2 потому, что авторы файлов использовали софт который на эту «спецификацию» забивает.
эти файлы открываются ридерами и их можно читать потому, что авторы ридеров на эту «спецификацию» забивают.
в результате того, что мертворожденный fb2 не нужен обоим сторонам, а читатель на экране не видит разницы, внимание вопрос: сколько нужно лишних хромосом, чтобы пример выше принять за некий «формат»?
и сколько нужно человеко-часов, чтобы из полутора терабайт этих файлов вытащить метаданные, если рандомные теги в рандомных местах с рандомной информацией внутри?
если и этот пост, с пятью рандомами из пяти, не добавляет осознания, у меня для вас плохие новости.

system-root ★★★★★
(20.12.17 22:33:02 MSK)

Ответ на: комментарий от system-root 20.12.17 22:33:02 MSK

авторы файлов использовали софт который на эту «спецификацию» забивает.

...а виноват формат, да?

Вот, пожалуйста, XML schema. Если какой-то файлогенерирующий софт генерирует мусор, который в эту схему не вписывается, надо писать багрепорты авторам софта, а не устраивать здесь клоунаду?

hobbit ★★★★★
(20.12.17 22:39:26 MSK)
Последнее исправление: hobbit 20.12.17 22:42:42 MSK (всего исправлений: 1)

Ответ на: комментарий от hobbit 20.12.17 22:39:26 MSK

а как ты думаешь? все виноваты, формат хороший, но никому ненужен?

system-root ★★★★★
(20.12.17 22:44:15 MSK)

Ответ на: комментарий от system-root 20.12.17 22:44:15 MSK

Пока что про «ненужен» заявляешь тут только ты.

Читалки поддерживают отступления от спецификации только для того, чтобы читатель что-то видел. Если ты не в курсе, точно так же поступают веб-браузеры с HTML.

Виноваты могут быть генераторы файлов. К ним и вопросы.

hobbit ★★★★★
(20.12.17 22:48:04 MSK)

Ответ на: комментарий от hobbit 20.12.17 22:39:26 MSK

надо писать багрепорты авторам софта
крупнейшее нелегальное собрание всех fb2 файлов находится именно в таком состоянии
полтора терабайта

напомни, где ключи от машины времени лежат, хочу сгонят в те времена, когда флибуста запускалась. объяснить этому дяде из жарких стран, что на сайте надо брать метаданные из загружаемого файла, а не формы для описания.

system-root ★★★★★
(20.12.17 22:48:29 MSK)

Ссылка

Ответ на: комментарий от hobbit 20.12.17 22:48:04 MSK

Читалки поддерживают отступления от спецификации только для того, чтобы читатель что-то видел.

проверь, как читалки поступят с pdf
и да, html — это не xml, там можно что хочешь творить, но автор выбрал xml.
конечно, можно долго рассказывать про багфиксы и мою ненужность в этом треде. вот только сотни тысяч файлов уже много лет испорчены и машинным методом их обработать разве что через sed\awk представляется возможным.
прекрасный формат fb2, идеальный для книг.

system-root ★★★★★
(20.12.17 23:00:05 MSK)

Ответ на: комментарий от system-root 20.12.17 23:00:05 MSK

Да, прекрасный.

Я, кстати, сходил, почитал ту тему. Тебе там давали вполне дельные советы, как его парсить. Но ты предпочёл позицию «я д'Артаньян, остальные ЛГБТ, говно, говно, говно».

Круглое колесо-то хоть создал? А то люди как пользовались FB2, так и пользуются, мучаются, бедные...

и да, html — это не xml, там можно что хочешь творить

Ну в общем-то, не совсем, на HTML тоже стандарты есть. Но браузерописатели решали практическую задачу, чтобы работало.

hobbit ★★★★★
(20.12.17 23:07:04 MSK)
Последнее исправление: hobbit 20.12.17 23:13:06 MSK (всего исправлений: 2)

Ответ на: комментарий от system-root 20.12.17 21:58:41 MSK

кто поддерживает FB2? вопрос на засыпку.

Все?

ugoday ★★★★★
(20.12.17 23:07:48 MSK)

Ссылка

Ответ на: комментарий от hobbit 20.12.17 23:07:04 MSK

Тебе там давали вполне дельные советы, как его парсить

сейчас цифры с потолка назову, ну так, чтобы ты понимал.
тысяча жанров, 50% это опечатки или мусор.
тысячи файлов без метаданных об авторе
пятнадцать кодировок
и так далее, там много было проблем из которых кодировка не самая большая, всего лишь прочесть все файлы с диска полностью.
у тебя есть полтора терабайта файлов, половина из которых мусор для парсера. ты будешь открывать каждый и гугулить фразы из текста, чтобы узнать что это вообще такое?
ты руками будешь забивать в базу тысячи кривых жанров и нормальное представление для них?
и так далее.
сначала ты не понимал разницу между словом «формат» и «расширение файла», теперь ты не понимаешь разницу между «скачал книгу» и распарсил полтора терика мусора руками?
давай, расскажи мне какой он прекрасный.png
в чём его прекрасность, кроме того, что ты как конечный пользователь можешь читать текст на экране? просто киллерфича. ага.

system-root ★★★★★
(20.12.17 23:25:59 MSK)

У FB2 есть и преимущества: отсутствие поддержки DRM, чем грешит EPUB. Отсутствие встроенных уродских шрифтов. В fb2 горе-дизайнеры не могут задать свои огромные межстрочные интервалы, или слишком узкие поля, или ещё как-нибудь испортить мне форматирование, в отличие от EPUB, где этим страдает каждый первый документ. Вот почему FB2 нужно.

Deleted
(20.12.17 23:37:02 MSK)

Ответ на: комментарий от system-root 20.12.17 23:25:59 MSK

А ещё можно нос себе нарошно дверью прищемить, а потом всем рассказывать про неправильные двери.

ugoday ★★★★★
(21.12.17 00:46:13 MSK)

Ответ на: комментарий от ugoday 21.12.17 00:46:13 MSK

себе нарошно
себе
нарошно

тоже хочешь поучаствовать? отлично. что «себе» и что «нарошно» объясни сначала и продолжим исходя из этого.

system-root ★★★★★
(21.12.17 01:01:56 MSK)

Ответ на: комментарий от system-root 21.12.17 01:01:56 MSK

Я смотрю у вас не очень с абстрактным мышлением.

ugoday ★★★★★
(21.12.17 01:28:58 MSK)

Ответ на: комментарий от hobbit 20.12.17 21:42:45 MSK

Markdown-читалки для всех

Давай мне читалку с поддержкой прекрасного Markdown для моего PocketBook. И для всего остального зоопарка железячных читалок заодно.

Для Android

https://f-droid.org/packages/net.gsantner.markor/

Для Linux, Windows (возможно позже и macOS)

https://github.com/wereturtle/ghostwriter

P.S.: На Github'е куча подобного софта

https://github.com/search?o=desc&q=markdown reader&s=updated&type...

atsym ★★★★★
(21.12.17 01:43:46 MSK)

Ссылка

Ответ на: комментарий от ugoday 21.12.17 01:28:58 MSK

какое может иметь отношение абстрактное мышление к детерминированному xml?
или каталогизации книг? (кстати да, скудные метаданные, описываемые вашим богоподобным форматом, взяты с потолка школьником, который даже БСЭ или вики не открыл)

system-root ★★★★★
(21.12.17 01:57:56 MSK)

Ответ на: комментарий от Deleted 20.12.17 23:37:02 MSK

У FB2 есть и преимущества: отсутствие поддержки DRM, чем грешит EPUB

Для меня главное преимущество fb2 — оно в среднем в 7 раз меньше, чем epub :) С fb2 в электронную книжку влезает вся моя коллекция в гигабайт размером, в epub — нет :)

в отличие от EPUB, где этим страдает каждый первый документ

Это да.

~~KRoN73~~ ★★★★★
(21.12.17 03:29:17 MSK)

Ссылка

Ответ на: комментарий от lucentcode 20.12.17 20:48:50 MSK

А вообще, для Linux по идее electron-based читалку пилить нужно

А зачем читать на десктопе? В XXI-м то веке? Я как купил в 2001-м первый КПК, Casio PV, так больше чтением на десктопе и не страдал.

А чтобы быстро найти нужное — Изумительный способ чтения fb2 под Linux

~~KRoN73~~ ★★★★★
(21.12.17 03:33:57 MSK)

Ответ на: комментарий от KRoN73 21.12.17 03:33:57 MSK

А чтобы быстро найти нужное —

Изумительный способ чтения fb2 под Linux

Кстати, там же в коде браузера lynx можно немного подшаманить - и будет нативная читалка fb2 под Linux-based ;-)

atsym ★★★★★
(21.12.17 03:44:31 MSK)

Ссылка

Ответ на: комментарий от KRoN73 21.12.17 03:33:57 MSK

А зачем читать на десктопе? В XXI-м то веке?

А зачем вообще читать?? «В XXI-м то веке?» © :)

Вообще-то говоря, мотивы и причины у людей могут быть очень разные. Например, иногда есть возможность, а то и необходимость, что-то читать в ожидании ответа/решения клиента и/или параллельно с работой, выполнять которую на E-Ink читалке мне по-прежнему не очень комфортно. ;)

Я как купил в 2001-м первый КПК, Casio PV, так больше чтением на десктопе и не страдал.

А мы и не страдаем — мы наслаждаемся. ;) :))

Somebody ★★★★
(21.12.17 05:15:20 MSK)

Ответ на: комментарий от system-root 21.12.17 01:57:56 MSK

какое может иметь отношение абстрактное мышление к детерминированному xml?

Вы постоянно сбиваетесь между частным и общим, путаете вместе разные вещи и разговариваете в стиле «в огороде бузина, а в Киеве — дядька».

ugoday ★★★★★
(21.12.17 10:22:08 MSK)

Ссылка

Ответ на: комментарий от system-root 20.12.17 23:25:59 MSK

сначала ты не понимал разницу между словом «формат» и «расширение файла»

Пруф, или не было.

теперь ты не понимаешь разницу между «скачал книгу» и распарсил полтора терика мусора руками?

О, Вангу включили.

Никто не спорит, что полтора терабайта мусора парсить плохо. Но опять-таки. чем виноват формат, что в нём делали кривые файлы?

hobbit ★★★★★
(21.12.17 12:46:06 MSK)

Ответ на: комментарий от KRoN73 21.12.17 03:33:57 MSK

Спасибо, вариант интересный. Я просто привык читать текст с большим размером шрифта с большого экрана(миопия и антипатия к очкам - корни этой привычки).

lucentcode ★★★★★
(21.12.17 13:16:21 MSK)

Ссылка

Ответ на: комментарий от Somebody 21.12.17 05:15:20 MSK

А мы и не страдаем — мы наслаждаемся. ;) :))

Это точно:)

lucentcode ★★★★★
(21.12.17 13:17:27 MSK)

Ссылка

Ответ на: комментарий от hobbit 21.12.17 12:46:06 MSK

чем виноват формат, что в нём делали кривые файлы?

чем виноват формат, что ему не следуют?
это как спросить «а всём виноват закон? его просто не исполняют, а сам то он хороший»
какая-то непробиваемая стена тупизма образовалась в треде по простой причине.
я потратил некоторое время на работу с fb2, изучил как историю его популярности в России (виноват владелец флибусты) так и результатов его популярности — это два архива файлов на флибусте и либрусек находящиеся в полностью неконсистентном состоянии внутри которых просто куча артефактов которые нужно вручную восстанавливать или выкинуть.
достаточно хорошо знаю xml, прочитал прилично про опыт стран в каталогизации, ну разобрался в вопросе нормально так.
а теперь пожалуйста, или конкретику или идите нафиг.
моя ультимативная конкретика — формат говно, автор школотрон.
в его задачу должно было входить создать схему для метаданных, создать разметку для текста и нормальный lifecycle самого формата.
три вещи, всего три. даже ПТУшник смог бы осилить две из них. автор не смог.
метаданные скудные, видно по версиям, как он вспоминал, что неплохо бы добавить, ну вообще не изучал вопрос, как блин книги хранить.
разметка? ну на заре появления гипертекста было лучше. в 1980-х
lifecycle как у расового школотрона, нельзя выпустить тыщу xml документов по схеме v1 и потом сказать, что они не валидны, т.к. теперь новая версия схемы v2, затем повторить это ещё пару раз. нормальные ребята сначала думают, что будет с легаси, кто будет конвертировать старые и так далее. в итоге весь спектр рандома внутри любого файла который был выпущен в те времена.

конкретику или идите нафиг.

system-root ★★★★★
(21.12.17 14:34:12 MSK)

Ответ на: комментарий от Deleted 20.12.17 12:12:54 MSK

Да ладно?

``` poem
Я помню чудное мгновенье:
Передо мной явилась ты,
Как мимолетное виденье,
Как гений чистой красоты.

В томленьях грусти безнадежной.
В тревогах шумной суеты,
Звучал мне долго голос нежный.
И снились милые черты.
```

onetoomany
(21.12.17 14:38:11 MSK)

Ответ на: комментарий от onetoomany 21.12.17 14:38:11 MSK

зачем тебе маркдаун, если ты стих моноширинным шрифтом и без форматирования пишешь?

Deleted
(21.12.17 14:39:39 MSK)

Ответ на: комментарий от Deleted 21.12.17 14:39:39 MSK

Почему моноширинным? Какого форматирования? Как отображать - это уже дело вьюера. Будет поддерживать такое расширение для стихов (совместимое, замечу, с ванильным markdown) - будет отображать как надо.

onetoomany
(21.12.17 14:43:19 MSK)

Ответ на: комментарий от onetoomany 21.12.17 14:43:19 MSK

Почему моноширинным?

О чём с тобой говорить? Ты показал разметку, но не знаешь что она означает.

Deleted
(21.12.17 14:44:55 MSK)

Ссылка

Ответ на: комментарий от system-root 21.12.17 14:34:12 MSK

А я потратил некоторое время на работу с EPUB, изучил как историю его популярности в Мире (виноваты книготорговцы) так и результатов его популярности — это чуть более, чем все нерусскоязычные е-книжки, находящиеся в полностью неконсистентном состоянии, внутри которых просто куча HTML и CSS, которые нужно вручную восстанавливать или выкинуть. Достаточно хорошо знаю xml, прочитал прилично про опыт стран в каталогизации, ну разобрался в вопросе нормально так - в EPUB можно использовать не менее трёх разных форматов метаданных, т. е. полная крейза. а теперь пожалуйста, или конкретику или идите нафиг. моя ультимативная конкретика — формат говно, авторы базарные торговцы. в их задачу должно было входить создать схему для метаданных, создать семантическую разметку для текста и нормальный lifecycle самого формата. три вещи, всего три. даже ПТУшник смог бы осилить две из них. автор не смог. в метаданных бардак, семантической разметки - нет, книготорговцам вообще похрену блин, как книги хранить - они не библиотека, им надо нахерачить красивого оформления, продать и забыть. И чтобы оно красиво смотрелось именно в их читалке. Проблемы конкурентов их не волнуют. на заре появления гипертекста было лучше. в 1980-х lifecycle как у расового школотрона, нельзя выпустить тыщу xml документов по схеме EPUB 2 и потом сказать, что они не валидны, т.к. теперь новая версия схемы 3, затем повторить это ещё пару раз. нормальные ребята сначала думают, что будет с легаси, кто будет конвертировать старые и так далее. в итоге весь спектр рандома внутри любого файла который был выпущен в те времена.

anonymous
(21.12.17 14:57:28 MSK)

Ответ на: комментарий от anonymous 21.12.17 14:57:28 MSK

ага, в epub достаточно прочесть package version чтобы понять какая это версия. дофига тупой анон.

system-root ★★★★★
(21.12.17 15:37:35 MSK)

Ответ на: комментарий от system-root 21.12.17 15:37:35 MSK

Достаточно для чего, штоп сематническая разметка появилась? Вылазь из лужи, там ссачо.

anonymous
(21.12.17 15:44:06 MSK)

Ответ на: комментарий от anonymous 21.12.17 15:44:06 MSK

OEBPS/*.opf открываешь, смотришь package version и читаешь metadata. от языка и автора до издателя.
переписал мою пасту, но у тебя не вышло, вообще не получается так-же с epub. там всё по другому.

system-root ★★★★★
(21.12.17 15:55:04 MSK)

Ответ на: комментарий от system-root 21.12.17 15:55:04 MSK

Ему про семантическую разметку, он про метаданные. Ты клоун-аутист?

anonymous
(21.12.17 15:58:54 MSK)

Ответ на: комментарий от anonymous 21.12.17 15:58:54 MSK

я вообще не понимаю зачем ты эту разметку приплетаешь. причём здесь она твоя паста? попрыгать по разным темам?
в твоей пасте про epub lifecycle херовый, это не так, есть тег package. разметка херовая? лол, там xhtml с медиа-контентом и свои шрифты.
метаданные через жопу? нет, формат делали гуглы\эплы\издатели\университеты, а не один не обученный школьник.

system-root ★★★★★
(21.12.17 16:06:11 MSK)
Последнее исправление: system-root 21.12.17 16:06:34 MSK (всего исправлений: 1)

Ответ на: комментарий от system-root 21.12.17 16:06:11 MSK

Ты вообще нихера не понимаешь, но выскакиваешь с заявлениями космического масштаба и космической же глупости. Как с тобой разговаривать?

anonymous
(21.12.17 16:10:15 MSK)

Ответ на: комментарий от anonymous 21.12.17 16:10:15 MSK

ой блин или конкретику или иди в жопу, уже писал. эти аллегории про космический масштаб и дартаньянов оставь для systemd в толксах.

system-root ★★★★★
(21.12.17 16:11:40 MSK)

Ссылка

Ответ на: комментарий от system-root 20.12.17 11:35:17 MSK

Если у него читалка fb2 только умеет и у него там вся библиотека?

Deleted
(21.12.17 16:24:42 MSK)

Ссылка

Ответ на: комментарий от system-root 21.12.17 14:34:12 MSK

моя ультимативная конкретика — формат говно, автор школотрон.

У тебя ФГМ о острой терминальной фазе :)

Ты написал в общем то о том что мир - ВНЕЗАПНО! - не совершенен, как это бывает у 99% XML-шикофф :) Ты написал о том что ты долго пытался и не осилил :) Ты обозвал других какахами потому что они сделали не как ты хотело. Естественно своего ты не сделало вообще, ты ту не для делать же, а для наср**** :) Ты написал о том что ты всё же Д'Артаньян, а «нешмогла» не потому что нешмогла, а потому что москали ВНЕЗАПНО! и ковано в твои шаровары ... :)

И ты не написал главного - вон он ФОРМАТ который спасёт мир! Пользуйте! И мы как благодарное человечество сразу же на него переключимся. И будем говорить о том да как же мы вообще жили с этим мерзким fb2 ?!?!?! ... и будем приносить тебе заслуженное пиво и женщин :))))

Знаешь как всё будет в реале? FB<number> будет ещё долго жить. А ты уйдёшь никому не известным задротом. Не обижаеся system-root, this is really a cruel world, nothing peronsl! :-\ как говорят на юге Рязани (С)

Как то так.

anonymous
(21.12.17 20:51:19 MSK)

Ссылка

а что, не виноват? Если формат хорош, то когда сделаешь кривой файл, он будет уже не этого формата, и бракоделу придется сделать по-нормальному, для соответствия формату.

А если формат плох, то бракоделы процветают. Неужели самому то нравится анархия в метаданных?

Конечно, всё-всё валидировать не удастся, но уж структуру то можно фиксировать!

Deleted
(23.12.17 10:22:43 MSK)

Ссылка

Ответ на: Оглавление от grozin 23.12.17 09:52:57 MSK

Оглавление в FB2 генерирует просмотрщик из заголовков. То-есть, если в исходном документе заголовки были выделены как заголовки, то в FB2 оглавление будет.

cdslow ★★
(23.12.17 16:59:03 MSK) автор топика

Ссылка

Markdown-читалки для всех

Оглавление

Похожие темы