LINUX.ORG.RU
решено ФорумTalks

Сделать электронную книгу из сотни html

 , ,


0

3

Приветствую!

А как можно из слитых страниц сайта сделать книгу для читалки/планшета? Пытался сделать через LibreOffice, но упахался вычищать всякие фреймы, левые картинки и прочее непотребство. Страницы - просто текст + иногда картинки-схемы.

Не знаю в какой раздел писать, потому как вроде не разработка...

Спасибо.

★★

Последнее исправление: ossa (всего исправлений: 1)

Никак

Если коротко, то никак. Если чуть длиннее, то качество результата сильно зависит от качества исходника. Если есть «версия для печати», то считай повезло. И таки распечатывать лучше прямо из браузера.

Camel ★★★★★
()

Можно попробовать Pandoc, но вычищать «всякие фреймы, левые картинки и прочее непотребство» всё равно придётся.

svobodka_fighter
()
Ответ на: Никак от Camel

Версии для печати нет.

Чтож, придется опять за питон браться и выколупывать фреймы с нужным текстом.

ossa ★★
() автор топика

я б обьединил сотню html в один большой, вырезав только нужные куски с помощью XSLT. а затем конвертнул бы в fb2 или pdf.

Komintern ★★★★★
()
Ответ на: комментарий от svobodka_fighter

О. Штука интересная. Надо порыть.

ossa ★★
() автор топика
Ответ на: комментарий от Komintern

Да, так видимо и придется =)

ossa ★★
() автор топика
Ответ на: комментарий от svobodka_fighter

Да, это оно. Даже при первом заходе оно сделало больше, чем я за час. А еще тут всякие шаблоны можно и прям с сайта тянуть. Спасибо =]

ossa ★★
() автор топика

kindlegen от Amazon соберет вам mobi. gepub соберет epub (придется написать набольшой скрипт на ruby)

ins3y3d ★★★★★
()
Ответ на: комментарий от Komintern

Или epub, что-бы преобразований поменьше. Epub это по сути кучка html в архиве

MrClon ★★★★★
()
Ответ на: комментарий от uin

Именно. По сути, epub (без DRM) — это просто zip, в который запиханы html-ки и немного метаинформации.

Я как-то делал epub руками — могу скинуть результат, если надо.

Miguel ★★★★★
()
Ответ на: комментарий от ossa

Самое простое, под офф-топиком:
- всё распечатать в pdf
- загрузить в finereader (он не только распознаёт, но и pdf текст читает)
- поправить слегка

Shadow ★★★★★
()
Ответ на: комментарий от Miguel

Так можно же в Calligra тогда сделать, я помню у нее из html в fb2 было не очень конвертация, а вот в epub все отлично.

uin ★★★
()
Ответ на: комментарий от ossa

Если страниц не очень много, то для ФФ был scrapbook. Там очень удобно можно было удалять лишнее и быстро делать версию для печати. Хотя scrapbook вообще не для этого.

sergej ★★★★★
()

Pandoc победил =)

Он умеет завернуть все страницы в epub, он умеет вывернуть все html в один большой html, шаблоны пока не курил, но, думается, что там даже можно выдернуть нужный фрейм. Картинки просто можно из директории дропнуть и сказать пандоку, чтоб он игнорил несуществующие. В общем штука реально полезная.

ossa ★★
() автор топика
Ответ на: комментарий от bookman900

много адовой ненужной работы, например.

Shadow ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.