[хочется странного] прокси html -> xhtml

0

1

Пока видел только: http://schneegans.de/xp/, но онлайн (и вроде лишь меняет mime).

Желательно в локальном виде, встречались ли вам готовые решения?

// use case: ну, например, выцепить линки через `xmllint'

Ссылка

←	[tcl][cookie] не ставятся :(

Нужно сделать WEB версию GoldenDict

→

Вроде многие HTML-парсеры умеют результат парсинга выплюнуть в виде XML. Только это все не очень хорошее решение. Лучше парсь HTML и не парь мозг, проще будет.

dizza ★★★★★
(22.08.11 15:48:21 MSK)

Ссылка

http://www.crummy.com/software/BeautifulSoup/ - заявлено, что даже кривые страницы парсит.
Линки тоже легко выдирает.

pi11 ★★★★★
(22.08.11 22:52:03 MSK)

>use case: ну, например, выцепить линки через `xmllint'

Ты хочешь HTML парсер, который умеет XPath-подобные штуки.

Deleted
(23.08.11 01:29:04 MSK)

Ответ на: комментарий от pi11 22.08.11 22:52:03 MSK

Он тормоз, лучше lxml.

rival ★★
(23.08.11 01:31:42 MSK)

Ссылка

Прокси.

import sys
from lxml import etree

root = etree.parse(sys.stdin, etree.HTMLParser())
print etree.tostring(root, encoding='utf8', pretty_print=True, method='xml')

~~baverman~~ ★★★
(23.08.11 01:43:13 MSK)

Ответ на: комментарий от baverman 23.08.11 01:43:13 MSK

Спасибо... Но так и я умею, на данном этапе интересует что-нибудь более готовое (скажем, с логами и демонами), какие подводные камни могут быть etc, определиться: хотелка просто странная или еще и ненужная.

n01r ★★
(23.08.11 12:04:47 MSK) автор топика

Ответ на: комментарий от Deleted 23.08.11 01:29:04 MSK

> Ты хочешь HTML парсер, который умеет XPath-подобные штуки.

Чем строже источник, тем меньше ограничений на допустимые преобразования.

xslt можно вспомнить. Так взял бы просто тот же `scrapy'.

n01r ★★
(23.08.11 12:07:03 MSK) автор топика

Ссылка

Qt WebKit для получения DOM, а транслятор DOM->XML напишешь сам

~~stevejobs~~ ★★★★☆
(24.08.11 09:50:51 MSK)

Ссылка

Ответ на: комментарий от n01r 23.08.11 12:04:47 MSK

интересует что-нибудь более готовое (скажем, с логами и демонами), какие подводные камни могут быть etc.

O_o.

хотелка просто странная или еще и ненужная.

Именно. Это просто xml парсер, какие логи, какие демоны?

~~baverman~~ ★★★
(25.08.11 16:27:27 MSK)

Ответ на: комментарий от baverman 25.08.11 16:27:27 MSK

> Это просто xml парсер, какие логи, какие демоны?

Вам напомнить как изначально озвучивался желаемый функционал?

n01r ★★
(26.08.11 15:11:30 MSK) автор топика

Ответ на: комментарий от n01r 26.08.11 15:11:30 MSK

Когда это на лоре давали дельные советы по решению странных проблем? Мы же добра желаем, а лишние костыли до него не доведут. Тем более предпосылки продемонстрированы не были.

~~baverman~~ ★★★
(26.08.11 15:17:43 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	[tcl][cookie] не ставятся :(

Web-development

Нужно сделать WEB версию GoldenDict

→

Похожие темы