LINUX.ORG.RU

Замена части строки

 


1

1

Господа, есть строка такого вида <td class=«column-1»>96</td><td class=«column-2»>Николаев</td><td class=«column-3»>351</td> как мне красиво удалить HTML теги чтобы осталась строка только такого вида

96 Николаев 351

Предполагаю что нужно использовать sed, но никак не могу ему правильную инструкцию подсунуть.

sed 's/<>/[^]' filename не работает

echo '<td class=«column-1»>96</td><td class=«column-2»>Николаев</td><td class=«column-3»>351</td>' | perl -pi -e 's/<.*?>/ /gi'
kostik87 ★★★★★
()
Ответ на: ? от anonymous

Спасибо!

IliaNikolaev
() автор топика

xml sel -t -m "//td[@class='column-1']/../td" -v . -o ' '

anonymous
()

Используй парсер в приспособленном для такого языке.

anonymous
()

Какая стоит первоначальная задача? Откуда взята эта строка с тегами?
lynx --dump url
А дальше разбирай sed и awk как текст без тегов.

imul ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.