Конвертация книжки из множества html в один архив

firefox, html, sigil, книги, конвертация

0

2

Привет.

Есть такая книжка http://physiclib.ru/books/item/f00/s00/z0000026/

Еще я нашел djvu на флибусте, но там совсем нераспознаный вариант.

Хочу из упомянутой ссылки сделать один архив, типа MAFF, MHTML или подобный. pdf не желателен. Что-то я туплю. Плагин MAFF для Firefox сыплет ошибками при попытке конвертнуть скачанные страницы все вместе. Если по-обезьяньи, по одной ссылке руками сохранять, то не получается сделать один связный архив.

Короче, помогите. Спасибо!

Ссылка

← Steam под Wine: не отображается web-store и прочие странички

git удалить мусор →

http://calibre-ebook.com/ ?

anTaRes ★★★★
(17.12.16 19:05:59 MSK)

Calibre

~~Deathstalker~~ ★★★★★
(17.12.16 19:18:47 MSK)

Ссылка

Ответ на: комментарий от anTaRes 17.12.16 19:05:59 MSK

Не вижу, как в калибри это сделать. Подскажи, плиз

Deleted
(17.12.16 22:13:01 MSK)

Ответ на: комментарий от Deleted 17.12.16 22:13:01 MSK

https://lh6.ggpht.com/_lG58t3XWd3c/SwsfKwvvC0I/AAAAAAAAABo/dnQgVrEwinw/s800/c...
где-то там, скорее всего
очень давно ее пользовал

посмотри в сторону всяких меню Create/Convert/Import и в сторону плагинов
я помню оно делало из rss-лент книжки по расписанию, должно и с html справиться

но я не уверен (потому и "?")

anTaRes ★★★★
(17.12.16 22:25:41 MSK)

Ссылка

Можно попробовать вытащить всё с помощью wget и затем слить в одну html.

anonymous
(18.12.16 00:46:02 MSK)

Ответ на: комментарий от anonymous 18.12.16 00:46:02 MSK

Для слияния в одну HTML какие есть автоматические инструменты?

Калибри, с горем пополам, делает некий htmlz, зазипованный каталог со всеми страничками, ссылки в которых перестали работать. Уныло.

Руками переверстать осталось

Deleted
(18.12.16 06:33:25 MSK)

О, народ! Вот это лучшее: Sigil is a multi-platform EPUB ebook editor https://github.com/Sigil-Ebook/Sigil

А ведь знал про нее. Кодировки поправляем, конвертим в utf8 странички, потом загружаем все html в Sigil - и все шоколадно (ну почти, немного табличная верстка в шапке поехала почему-то)

Deleted
(18.12.16 07:15:19 MSK)
Последнее исправление: Deleted 18.12.16 07:15:55 MSK (всего исправлений: 1)

Открыл несколько случайных страниц. Есть причина MAFF, MHTML и другую экзотику использовать? Я к тому, что кроме картинок там ничего нет

А так. Берешь wget и качаешь

.../z0000026/st001.shtml
.../z0000026/st002.shtml
...
.../z0000026/st114.shtml

Приблизительно так

wget -nd -P book/$X -A jpeg,jpg,bmp,gif,png http://.../$X.shtml

Затем парсишь сам текст (HTML здесь в лоб распарсится). Можно использовать jQuery. Затем легко делать что захочешь, например собрать в один большой HTML, или просто вытащить все в plaintext

gopnik
(18.12.16 07:16:37 MSK)