LINUX.ORG.RU

Ответ на: комментарий от suser

> Нужна удобная работа в виде дерева.

AFAIK HTML::Tree предусматривает работу именно "в виде дерева",
http://search.cpan.org/~petdance/HTML-Tree-3.1901/lib/HTML/Tree.pm

На будущее рекомендую http://search.cpan.org - очень помогает.

И конечно - архивы comp.lang.perl.misc на groups.google.com.

HTH

Onanim
()
Ответ на: комментарий от suser

> Жаль в сегфолт иногда валится... Придётся регекспами делать.

Регэкспами HTML не парсится (возможно за исключением самых
простых случаев). Многократно обсуждено в comp.lang.perl.misc.
Не рекомендую задавать там вопрос о парсинге HTMLа при помощи
регулярных выражений - в лучшем случае просто проигнорируют :-)))

Рекомендую все-таки разобраться с каким-то из модулей, на мой
взгляд HTML::Tree достаточно хорош (длинная история, много релизов,
рейтинг, тесты).
Документация HTML::Element и HTML::TreeBuilder на мой взгляд хороша,
кроме того HTML::Tree содержит ссылки на статьи (в формате perldoc).
Короче http://search.cpan.org/~petdance/HTML-Tree-3.1901/lib/HTML/Tree.pm
и далее по ссылкам.

HTH

Onanim
()
Ответ на: комментарий от Onanim

Всё же регекспами страницы с 10+ уровнями вложенности парсить проще. Ну ещё кое-где split можно применить.

suser
() автор топика
Ответ на: комментарий от suser

> Всё же регекспами страницы с 10+ уровнями вложенности парсить проще. Ну ещё кое-где split можно применить.

Да ради бога, КССЗБ :-)))

Onanim
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.