LINUX.ORG.RU

История изменений

Исправление Rainor, (текущая версия) :

Хвататься в xpath за text() - сомнительная затея, если тот не нормализирован в понятном для парсера виде.

Плясать придется в сторону

r'''//*[contains(text(), "Ne'xt") or contains(text(), "Ne%27xt") or contains(text(), "Ne`xt" и т.д.) ]'''

P.S. Отсутствие формализации таких случаев и приводит к тому, что подчас html проще парсить регулярками, чем xpath\csspath.

Исправление Rainor, :

Хвататься в xpath за text() - сомнительная затея, если тот не нормализирован в понятном для парсера виде.

Плясать придется в сторону

r'''//*[contains(text(), "Ne'xt") or contains(text(), "Ne%27xt") or contains(text(), "Ne`xt" и т.д.) ]'''

P.S. Отсутствие формализации таких случаев и приводит к тому, что подчас html проще парсить регулярками, чем xpath\csspath.

Исходная версия Deleted, :

Хвататься в xpath за text() - сомнительная затея, если тот не нормализирован в понятном для парсера виде.

Плясать придется в сторону

r"'//*[contains(text(), «Ne'xt») or contains(text(), «Ne%27xt») or contains(text(), «Ne`xt» и т.д.) ]"'

P.S. Отсутствие формализации таких случаев и приводит к тому, что подчас html проще парсить регулярками, чем xpath\csspath.