LINUX.ORG.RU

Получить подстроки, зная их начало и конец


0

2

Привет.

Как выбрать из большого файла подстроки, зная их начало и конец?

Например, текст из html-тегов:
<span class=«special»>текст</span>

Если бы он был разбит построчно, можно было бы выбрать нужные строки grep'ом и удалить лишнее при помощи sed substitution, но в файлике текст идет одной строкой.

Спасибо.

1) xpath

2) в два прохода с помощью sed

Rzhepish ()
echo '111111<span class="special">текст</span>222222' |grep -Eo '<span class="special">.+</span>'
<span class="special">текст</span>

Дальше разберёшся.

uzbl ()
% echo '<span class="special">текст1</span><span class="special">текст2</span>' | grep -Po '<span class="special">\K.*?(?=</span>)'
текст1
текст2
zolden ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.