Требуеться
парсер который прожует HTML
и создаст из него dom модель
я на вскидку знаю 2 таких libtidy и libxml
возможно подскажете что-то еще ?
критерий выбора это скорость разбора
и умение нормально разбирать
HTML конченого вида который нагенерен
всякими быдлоскриптами, с незакрытыми
или неправильно закрытыми тэгами,
левыми кусками которые непонятно к чему относяться
и т.д.
в общем если кто-то плотно сталкивался
с подобными задачами раскажите пожалуйста
какие есть либы и какие у них преимущества\недостатки.