Прошу заранее извинений, плохо читал про них, даже незнаю как их юзать и чем они отличаются. Просто реализовал HTML-парсер руками на C++ и надо ещё javascript парсить. Но не для того, чтобы его интерпретировать, а чтобы перешагнуть внутри HTML-документа.
Думаю - не попробовать ли переписать и HTML-парсер и javascript-парсер на bison + lex, чтобы «как у людей». Плюс ручной парсер не поддерживает utf-8 и потенциально запнётся и упадёт на каких-нибудь прикольных последовательностях - думаю как дело у bison + lex с этим?
HTML-документ у меня превращается в однонаправленный список структур, каждая из которых описывает HTML-тег (имя тега + список атрибутов, например «/A» + href=http://google.com, class=sobaka). Этот список структур я дальше употребляю в своих коварных целях.