LINUX.ORG.RU

beautifulsoup4. Либо измени синтаксис этих html-шаблонов, чтобы можно было с помощью какого-нибудь jinja2 их рендерить, подставляя в ссылки значения переменных.

dimuska139 ★★
()

lxml и xpath. Или, да, проще через Jinja2.

vvn_black ★★★★★
()
Последнее исправление: vvn_black (всего исправлений: 1)

Я для парсинга сайта использовал прекрасный суп четвёртой версии.

Хорошая библиотечка в плане синтаксического сахарка для работы с HTML-дриснёй.

EXL ★★★★★
()

Могу сказать что не стоит использовать. html.parser встроенный. Более убогого кала не найти.

IPR ★★★★★
()
Ответ на: комментарий от dimuska139

beautifulsoup4 рулит. отличная вещь. как я рад что её обнаружил, теперь буду всегда использовать. правильно там написано что It commonly saves programmers hours or days of work. документация также на высоте. python мне нравится всё больше и больше.

scripthacker
() автор топика
for file in files:
  with open(file, 'r+') as fp:
    contents = fp.read()
    contents = contents.replace('<a href="#', '<a href="file.html#') 
    fp.seek(0)
    fp.write(contents)
tz4678 ★★
()
Последнее исправление: tz4678 (всего исправлений: 1)
Ответ на: комментарий от scripthacker

beautifulsoup4 рулит. отличная вещь. как я рад что её обнаружил

Это первые впечатления. Потом, после близкого знакомства и попыток добиться того что надо, придёт разочарование.

vvn_black ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.