LINUX.ORG.RU

Вышла версия 0.1 программы fictionup — конвертера из Markdown в FB2

 , , ,


0

3

fictionup — конвертер из формата Markdown в формат FB2, который работает из командной строки. Он поддерживает ограниченный набор тэгов, описывающих метаинформацию, необходимую для создания корректных FB2-документов.

Программа основана на библиотеке Hoedown и поддерживает расширенный вариант разметки Markdown, включающий такие возможности, как таблицы и сноски.

Лицензия — GPL 3+.

Примеры исходного (Markdown) и конвертированного (FB2) документов.

>>> Сайт программы



Проверено: Shaman007 ()
Ответ на: комментарий от system-root

наверное нужно разжевать для особо одарённых, вроде анона.
крупнейшее нелегальное собрание всех fb2 файлов находится именно в таком состоянии. рандомные теги в рандомных местах. это невозможно распарсить, скажем в БД, используя «спецификацию» fb2 потому, что авторы файлов использовали софт который на эту «спецификацию» забивает.
эти файлы открываются ридерами и их можно читать потому, что авторы ридеров на эту «спецификацию» забивают.
в результате того, что мертворожденный fb2 не нужен обоим сторонам, а читатель на экране не видит разницы, внимание вопрос: сколько нужно лишних хромосом, чтобы пример выше принять за некий «формат»?
и сколько нужно человеко-часов, чтобы из полутора терабайт этих файлов вытащить метаданные, если рандомные теги в рандомных местах с рандомной информацией внутри?
если и этот пост, с пятью рандомами из пяти, не добавляет осознания, у меня для вас плохие новости.

system-root ★★ ()
Ответ на: комментарий от system-root

авторы файлов использовали софт который на эту «спецификацию» забивает.

...а виноват формат, да?

Вот, пожалуйста, XML schema. Если какой-то файлогенерирующий софт генерирует мусор, который в эту схему не вписывается, надо писать багрепорты авторам софта, а не устраивать здесь клоунаду?

hobbit ★★★★★ ()
Последнее исправление: hobbit (всего исправлений: 1)
Ответ на: комментарий от system-root

Пока что про «ненужен» заявляешь тут только ты.

Читалки поддерживают отступления от спецификации только для того, чтобы читатель что-то видел. Если ты не в курсе, точно так же поступают веб-браузеры с HTML.

Виноваты могут быть генераторы файлов. К ним и вопросы.

hobbit ★★★★★ ()
Ответ на: комментарий от hobbit

надо писать багрепорты авторам софта

крупнейшее нелегальное собрание всех fb2 файлов находится именно в таком состоянии
полтора терабайта

напомни, где ключи от машины времени лежат, хочу сгонят в те времена, когда флибуста запускалась. объяснить этому дяде из жарких стран, что на сайте надо брать метаданные из загружаемого файла, а не формы для описания.

system-root ★★ ()
Ответ на: комментарий от hobbit

Читалки поддерживают отступления от спецификации только для того, чтобы читатель что-то видел.

проверь, как читалки поступят с pdf
и да, html — это не xml, там можно что хочешь творить, но автор выбрал xml.
конечно, можно долго рассказывать про багфиксы и мою ненужность в этом треде. вот только сотни тысяч файлов уже много лет испорчены и машинным методом их обработать разве что через sed\awk представляется возможным.
прекрасный формат fb2, идеальный для книг.

system-root ★★ ()
Ответ на: комментарий от system-root

Да, прекрасный.

Я, кстати, сходил, почитал ту тему. Тебе там давали вполне дельные советы, как его парсить. Но ты предпочёл позицию «я д'Артаньян, остальные ЛГБТ, говно, говно, говно».

Круглое колесо-то хоть создал? А то люди как пользовались FB2, так и пользуются, мучаются, бедные...

и да, html — это не xml, там можно что хочешь творить

Ну в общем-то, не совсем, на HTML тоже стандарты есть. Но браузерописатели решали практическую задачу, чтобы работало.

hobbit ★★★★★ ()
Последнее исправление: hobbit (всего исправлений: 2)
Ответ на: комментарий от hobbit

Тебе там давали вполне дельные советы, как его парсить

сейчас цифры с потолка назову, ну так, чтобы ты понимал.
тысяча жанров, 50% это опечатки или мусор.
тысячи файлов без метаданных об авторе
пятнадцать кодировок
и так далее, там много было проблем из которых кодировка не самая большая, всего лишь прочесть все файлы с диска полностью.
у тебя есть полтора терабайта файлов, половина из которых мусор для парсера. ты будешь открывать каждый и гугулить фразы из текста, чтобы узнать что это вообще такое?
ты руками будешь забивать в базу тысячи кривых жанров и нормальное представление для них?
и так далее.
сначала ты не понимал разницу между словом «формат» и «расширение файла», теперь ты не понимаешь разницу между «скачал книгу» и распарсил полтора терика мусора руками?
давай, расскажи мне какой он прекрасный.png
в чём его прекрасность, кроме того, что ты как конечный пользователь можешь читать текст на экране? просто киллерфича. ага.

system-root ★★ ()

У FB2 есть и преимущества: отсутствие поддержки DRM, чем грешит EPUB. Отсутствие встроенных уродских шрифтов. В fb2 горе-дизайнеры не могут задать свои огромные межстрочные интервалы, или слишком узкие поля, или ещё как-нибудь испортить мне форматирование, в отличие от EPUB, где этим страдает каждый первый документ. Вот почему FB2 нужно.

renjumin ★★★ ()
Ответ на: комментарий от hobbit

Markdown-читалки для всех

Давай мне читалку с поддержкой прекрасного Markdown для моего PocketBook. И для всего остального зоопарка железячных читалок заодно.

Для Android

https://f-droid.org/packages/net.gsantner.markor/

Для Linux, Windows (возможно позже и macOS)

https://github.com/wereturtle/ghostwriter

P.S.: На Github'е куча подобного софта

https://github.com/search?o=desc&q=markdown reader&s=updated&type...

atsym ★★★★ ()
Ответ на: комментарий от ugoday

какое может иметь отношение абстрактное мышление к детерминированному xml?
или каталогизации книг? (кстати да, скудные метаданные, описываемые вашим богоподобным форматом, взяты с потолка школьником, который даже БСЭ или вики не открыл)

system-root ★★ ()
Ответ на: комментарий от renjumin

У FB2 есть и преимущества: отсутствие поддержки DRM, чем грешит EPUB

Для меня главное преимущество fb2 — оно в среднем в 7 раз меньше, чем epub :) С fb2 в электронную книжку влезает вся моя коллекция в гигабайт размером, в epub — нет :)

в отличие от EPUB, где этим страдает каждый первый документ

Это да.

KRoN73 ★★★★★ ()
Ответ на: комментарий от lucentcode

А вообще, для Linux по идее electron-based читалку пилить нужно

А зачем читать на десктопе? В XXI-м то веке? Я как купил в 2001-м первый КПК, Casio PV, так больше чтением на десктопе и не страдал.

А чтобы быстро найти нужное — www.linux.org.ru/forum/talks/3599767

KRoN73 ★★★★★ ()
Ответ на: комментарий от KRoN73

А зачем читать на десктопе? В XXI-м то веке?

А зачем вообще читать?? «В XXI-м то веке?» © :)

Вообще-то говоря, мотивы и причины у людей могут быть очень разные. Например, иногда есть возможность, а то и необходимость, что-то читать в ожидании ответа/решения клиента и/или параллельно с работой, выполнять которую на E-Ink читалке мне по-прежнему не очень комфортно. ;)

Я как купил в 2001-м первый КПК, Casio PV, так больше чтением на десктопе и не страдал.

А мы и не страдаем — мы наслаждаемся. ;) :))

Somebody ()
Ответ на: комментарий от system-root

какое может иметь отношение абстрактное мышление к детерминированному xml?

Вы постоянно сбиваетесь между частным и общим, путаете вместе разные вещи и разговариваете в стиле «в огороде бузина, а в Киеве — дядька».

ugoday ★★★★★ ()
Ответ на: комментарий от system-root

сначала ты не понимал разницу между словом «формат» и «расширение файла»

Пруф, или не было.

теперь ты не понимаешь разницу между «скачал книгу» и распарсил полтора терика мусора руками?

О, Вангу включили.

Никто не спорит, что полтора терабайта мусора парсить плохо. Но опять-таки. чем виноват формат, что в нём делали кривые файлы?

hobbit ★★★★★ ()
Ответ на: комментарий от hobbit

чем виноват формат, что в нём делали кривые файлы?

чем виноват формат, что ему не следуют?
это как спросить «а всём виноват закон? его просто не исполняют, а сам то он хороший»
какая-то непробиваемая стена тупизма образовалась в треде по простой причине.
я потратил некоторое время на работу с fb2, изучил как историю его популярности в России (виноват владелец флибусты) так и результатов его популярности — это два архива файлов на флибусте и либрусек находящиеся в полностью неконсистентном состоянии внутри которых просто куча артефактов которые нужно вручную восстанавливать или выкинуть.
достаточно хорошо знаю xml, прочитал прилично про опыт стран в каталогизации, ну разобрался в вопросе нормально так.
а теперь пожалуйста, или конкретику или идите нафиг.
моя ультимативная конкретика — формат говно, автор школотрон.
в его задачу должно было входить создать схему для метаданных, создать разметку для текста и нормальный lifecycle самого формата.
три вещи, всего три. даже ПТУшник смог бы осилить две из них. автор не смог.
метаданные скудные, видно по версиям, как он вспоминал, что неплохо бы добавить, ну вообще не изучал вопрос, как блин книги хранить.
разметка? ну на заре появления гипертекста было лучше. в 1980-х
lifecycle как у расового школотрона, нельзя выпустить тыщу xml документов по схеме v1 и потом сказать, что они не валидны, т.к. теперь новая версия схемы v2, затем повторить это ещё пару раз. нормальные ребята сначала думают, что будет с легаси, кто будет конвертировать старые и так далее. в итоге весь спектр рандома внутри любого файла который был выпущен в те времена.

конкретику или идите нафиг.

system-root ★★ ()
Ответ на: комментарий от subwoofer

Да ладно?

``` poem
Я помню чудное мгновенье:
Передо мной явилась ты,
Как мимолетное виденье,
Как гений чистой красоты.

В томленьях грусти безнадежной.
В тревогах шумной суеты,
Звучал мне долго голос нежный.
И снились милые черты.
```
onetoomany ()
Ответ на: комментарий от subwoofer

Почему моноширинным? Какого форматирования? Как отображать - это уже дело вьюера. Будет поддерживать такое расширение для стихов (совместимое, замечу, с ванильным markdown) - будет отображать как надо.

onetoomany ()
Ответ на: комментарий от system-root

А я потратил некоторое время на работу с EPUB, изучил как историю его популярности в Мире (виноваты книготорговцы) так и результатов его популярности — это чуть более, чем все нерусскоязычные е-книжки, находящиеся в полностью неконсистентном состоянии, внутри которых просто куча HTML и CSS, которые нужно вручную восстанавливать или выкинуть. Достаточно хорошо знаю xml, прочитал прилично про опыт стран в каталогизации, ну разобрался в вопросе нормально так - в EPUB можно использовать не менее трёх разных форматов метаданных, т. е. полная крейза. а теперь пожалуйста, или конкретику или идите нафиг. моя ультимативная конкретика — формат говно, авторы базарные торговцы. в их задачу должно было входить создать схему для метаданных, создать семантическую разметку для текста и нормальный lifecycle самого формата. три вещи, всего три. даже ПТУшник смог бы осилить две из них. автор не смог. в метаданных бардак, семантической разметки - нет, книготорговцам вообще похрену блин, как книги хранить - они не библиотека, им надо нахерачить красивого оформления, продать и забыть. И чтобы оно красиво смотрелось именно в их читалке. Проблемы конкурентов их не волнуют. на заре появления гипертекста было лучше. в 1980-х lifecycle как у расового школотрона, нельзя выпустить тыщу xml документов по схеме EPUB 2 и потом сказать, что они не валидны, т.к. теперь новая версия схемы 3, затем повторить это ещё пару раз. нормальные ребята сначала думают, что будет с легаси, кто будет конвертировать старые и так далее. в итоге весь спектр рандома внутри любого файла который был выпущен в те времена.

anonymous ()
Ответ на: комментарий от anonymous

OEBPS/*.opf открываешь, смотришь package version и читаешь metadata. от языка и автора до издателя.
переписал мою пасту, но у тебя не вышло, вообще не получается так-же с epub. там всё по другому.

system-root ★★ ()
Ответ на: комментарий от anonymous

я вообще не понимаю зачем ты эту разметку приплетаешь. причём здесь она твоя паста? попрыгать по разным темам?
в твоей пасте про epub lifecycle херовый, это не так, есть тег package. разметка херовая? лол, там xhtml с медиа-контентом и свои шрифты.
метаданные через жопу? нет, формат делали гуглы\эплы\издатели\университеты, а не один не обученный школьник.

system-root ★★ ()
Последнее исправление: system-root (всего исправлений: 1)
Ответ на: комментарий от system-root

Ты вообще нихера не понимаешь, но выскакиваешь с заявлениями космического масштаба и космической же глупости. Как с тобой разговаривать?

anonymous ()
Ответ на: комментарий от system-root

моя ультимативная конкретика — формат говно, автор школотрон.

У тебя ФГМ о острой терминальной фазе :)

Ты написал в общем то о том что мир - ВНЕЗАПНО! - не совершенен, как это бывает у 99% XML-шикофф :) Ты написал о том что ты долго пытался и не осилил :) Ты обозвал других какахами потому что они сделали не как ты хотело. Естественно своего ты не сделало вообще, ты ту не для делать же, а для наср**** :) Ты написал о том что ты всё же Д'Артаньян, а «нешмогла» не потому что нешмогла, а потому что москали ВНЕЗАПНО! и ковано в твои шаровары ... :)

И ты не написал главного - вон он ФОРМАТ который спасёт мир! Пользуйте! И мы как благодарное человечество сразу же на него переключимся. И будем говорить о том да как же мы вообще жили с этим мерзким fb2 ?!?!?! ... и будем приносить тебе заслуженное пиво и женщин :))))

Знаешь как всё будет в реале? FB<number> будет ещё долго жить. А ты уйдёшь никому не известным задротом. Не обижаеся system-root, this is really a cruel world, nothing peronsl! :-\ как говорят на юге Рязани (С)

Как то так.

anonymous ()
Ответ на: комментарий от hobbit

Но опять-таки. чем виноват формат, что в нём делали кривые файлы?

а что, не виноват? Если формат хорош, то когда сделаешь кривой файл, он будет уже не этого формата, и бракоделу придется сделать по-нормальному, для соответствия формату.

А если формат плох, то бракоделы процветают. Неужели самому то нравится анархия в метаданных?

Конечно, всё-всё валидировать не удастся, но уж структуру то можно фиксировать!

PtiCa ★★★★★ ()
Ответ на: Оглавление от grozin

Оглавление в FB2 генерирует просмотрщик из заголовков. То-есть, если в исходном документе заголовки были выделены как заголовки, то в FB2 оглавление будет.

cdslow ()