Требуется использовать какой-нибудь фреймворк или либу для парсинга HTML. Что посоветует великий ЛОР?
Имеется нерегулярный документ HTML, сохраненный, к примеру, с какого-то бложика. Содержащий текст на любом европейском/восточном языке, с/без форматирования, с/без ошибок в тегах, с/без прочим информационным мусором. Браузеры (webkit, в частности) его отображают нормально.
Требуется распарсить документ, вытаскивая из него строки отображаемого текста, например в виде абзацев/параграфов. Модифицировать эти строки, затем обратно вставлять их в текст. Требуется это делать не разрушая форматирование, хотя бы сохраняя его с точностью до границ выдранных параграфов.
Можно что-то, что будет загружать документ в дерево DOM, можно иные инструменты - неважно.
Пишется всё на c++ с qt4. Пробовал с qt-шным webkitом - не получается с ним анализировать все документы. Особенно где текст тупо набран и сверстан без использования div, span и p.
Извиняюсь, если это окажется бояном.
генератор правого торсионного поля, отклоняющий левое торсионное поле монитора на 180 градусов в зону его правого поля, т.е. в противоположную от пользователя сторону. В результате взаимодействия правого и отклоненного левого полей монитора они взаимно компенсируются, создавая безопасную зону как перед монитором, так и сзади его.
Принцип защитного действия состоит в отклонении на 180 градусов от левого торсионного поля, которое генерирует монитор персонального компьютера и взаимодействия его с правым торсионным полем задней стенки монитора, что ведет к взаимной компенсации этих полей.
Что-то никто не может ответить. Поэтому я хочу спросить у коллективного ЛОРовского разума, который никогда не подводил. Итак.
Ищется название советского(?) мультика.
Было как-то телевизору в конце 80х-начале 90х. В мульте показывают американскую(?) базу. Вроде там проводят какие-то эксперименты, или управляют чем-то. Весь персонал куда-то пропал.
Остался один ГГ. Помню момент - спускается он по лестнице - а она не заканчивается и ГГ попадает снова на тот же этаж, с которого вышел. Он пытается выпрыгнуть в окно - попадает в какой-то туман и снова возвращается в исходное состояние. Весь мульт состоял из такого бреда, чем собственно и доставил когда-то. Мульт был выполнен в желто-сине-черной цветовой гамме с неаккуратной карандашной рисовкой контуров предметов и персонажей.
В октябре, помню, был тут тред про сабж. В декабре он должен был уже выйти, посему вопрос - нет ли ни у кого этой книги в PDF/djvu?
Наткнулся тут на днях вот на такой бред - http://www.inauka.ru/blogs/article80247/print.html
Почитал, чувствую у человека куча ошибок в рассуждениях и расчетах. А точно определить не могу - электротехнику подзабыл. Прошу помощи у тех, кто выбирает слакварь, разобраться в этом бреде. :)