LINUX.ORG.RU

Переделать ~400 html.


0

1

Так получилось, что мне нужен сборник с задачами, выбрал проект Эйлера, не нашел склеенной версии, решил сделать по скрипту из этого сообщения, спасибо DesertFox. Но каждая pdfка получилось по ~1.7мб, если их склеить получается очень много :) Поэтому мне надо все эти 391 html страницы переделать из примерно такого: http://pastebin.com/DKuk0bUu в такое: http://pastebin.com/AjFTSadT

Вручную, естественно, не вариант. Как это автоматизировать?


Скрипт на питоне с использованием beautifulsoup?

PolarFox ★★★★★ ()
Ответ на: комментарий от PolarFox

Не знаю питон, но все равно спасибо, попробую.

z00ke ()
Ответ на: комментарий от z00ke

Любая знакомая тебе ковырялка DOM сойдёт. Например jquery.

PolarFox ★★★★★ ()

ps2pdf -dUseFlatCompression=true test.pdf Попробуй уменьшить так pdf если ещё актуально с pdf.

HunOL ★★★★ ()
Ответ на: комментарий от HunOL

Ужимает с 1.7 до 540, но все равно очень много. В моем случае получается 8.3кб, поэтому надо искать вариант, как ужать html, а не pdf.

z00ke ()
Ответ на: комментарий от z00ke

Взять любой знакомый язык программирования, распарсить и собрать новый html?

Забавно, что тебе помагают DesertFox и PolarFox. Ждём SwampFox и ForestFox.

aedeph_ ★★ ()
Ответ на: комментарий от aedeph_

Я неплохо владею только C/C++, но в них работа с текстом никуда не годится :)

z00ke ()

Там что, большинство задач на тупой перебор «в лоб»?

Eddy_Em ☆☆☆☆☆ ()
Ответ на: комментарий от Eddy_Em

Нет, только первые. Дальше начинаются вполне интересные :)

z00ke ()
Ответ на: комментарий от Eddy_Em

Большинство задач там тупым перебором не решить.

hope13 ★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.