LINUX.ORG.RU

Распарсить html

 ,


0

1

Доброго времени!

Суть проблемы такая. Есть страничка html, вот проблемный кусок:

....
<ul id="data">
<li>
<div>Addr </div> 
проблемный текст <br>
</li>
....
Собственно не могу получить «проблемный текст». Использую lxml. Делаю так:
tmp=html.document_fromstring(urlopen(url).read())
tmp.xpath("//ul[@id='data']/li")[0].text

Спасибо!

а может так проще будет парсить не xml странички?

from grab import Grab

g.go(url) g.pyquery('ul#data li')

fMad ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.