Perl HTML DOM

0

0

Чем лучше всего в Perl парсить HTML в виде DOM?

Ссылка

←	qt-win-opensource-4.1.2-mingw

ANT + build.xml. как создать zip-архивы?

→

AFAIK HTML::Parser (и сопутствующие).
(не путать с HTML::Parse)

Onanim ★
(24.05.06 14:36:02 MSK)

Ответ на: комментарий от Onanim 24.05.06 14:36:02 MSK

Жутко неудобная вещь HTML::Parser.

~~suser~~
(24.05.06 22:00:42 MSK) автор топика

Ответ на: комментарий от suser 24.05.06 22:00:42 MSK

Нужна удобная работа в виде дерева.

~~suser~~
(24.05.06 22:03:15 MSK) автор топика

Ответ на: комментарий от suser 24.05.06 22:03:15 MSK

> Нужна удобная работа в виде дерева.

AFAIK HTML::Tree предусматривает работу именно "в виде дерева",
http://search.cpan.org/~petdance/HTML-Tree-3.1901/lib/HTML/Tree.pm

На будущее рекомендую http://search.cpan.org - очень помогает.

И конечно - архивы comp.lang.perl.misc на groups.google.com.

HTH

Onanim ★
(24.05.06 22:18:00 MSK)

Ответ на: комментарий от Onanim 24.05.06 22:18:00 MSK

HTML::TagParser мне больше понравился.

~~suser~~
(24.05.06 23:32:19 MSK) автор топика

Ответ на: комментарий от suser 24.05.06 23:32:19 MSK

Жаль в сегфолт иногда валится... Придётся регекспами делать.

~~suser~~
(25.05.06 00:08:11 MSK) автор топика

Ответ на: комментарий от suser 25.05.06 00:08:11 MSK

> Жаль в сегфолт иногда валится... Придётся регекспами делать.

Регэкспами HTML не парсится (возможно за исключением самых
простых случаев). Многократно обсуждено в comp.lang.perl.misc.
Не рекомендую задавать там вопрос о парсинге HTMLа при помощи
регулярных выражений - в лучшем случае просто проигнорируют :-)))

Рекомендую все-таки разобраться с каким-то из модулей, на мой
взгляд HTML::Tree достаточно хорош (длинная история, много релизов,
рейтинг, тесты).
Документация HTML::Element и HTML::TreeBuilder на мой взгляд хороша,
кроме того HTML::Tree содержит ссылки на статьи (в формате perldoc).
Короче http://search.cpan.org/~petdance/HTML-Tree-3.1901/lib/HTML/Tree.pm
и далее по ссылкам.

HTH