LINUX.ORG.RU

html dom parser (+)


0

0

Требуеться
парсер который прожует HTML
и создаст из него dom модель
я на вскидку знаю 2 таких libtidy и libxml
возможно подскажете что-то еще ?

критерий выбора это скорость разбора
и умение нормально разбирать
HTML конченого вида который нагенерен
всякими быдлоскриптами, с незакрытыми
или неправильно закрытыми тэгами,
левыми кусками которые непонятно к чему относяться
и т.д.

в общем если кто-то плотно сталкивался
с подобными задачами раскажите пожалуйста
какие есть либы и какие у них преимущества\недостатки.

anonymous

>я на вскидку знаю 2 таких libtidy и libxml

А я ещё слышал про мозиллу, вебкит и закрытую оперу.

anonymous
()
Ответ на: комментарий от anonymous

мозила тяжеловата будет и довольно тормозная

webkit тоже кажеться совсем не легкий и быстрый

хотя может быть я ошибаюсь ? хотелось бы услышать мнение людей которые имели опыт работы с разными парсерами.

за TagSoup спасибо читаю про него.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.