[regexp]

0

3

Привет.

Покажите, пожалуйста, как захватить регуляркой несколько строк.

Вот так работает:

$ cat test
<h1>Мой заголовок</h1>

$ egrep "<[Hh]1>.*</[Hh]1>" test
<h1>Мой заголовок</h1>

А вот так - уже нет:

$ cat test
<h1>Мой 
заголовок</h1>

$ egrep "<[Hh]1>.*</[Hh]1>" test  | wc -l
       0

Спасибо.

Ссылка

← VPN + autoconnect/reconnect

[feature request] Инфо про бинарники →

1) Не нужно, 2) есть xmlstarlet, 3) если уж использовать xml с грепом - есть xml2, 4) нужно что-нибудь не только linewise (sam), или костыли (sed + :t, N), ruby (можно и питон):

ruby -e 'puts STDIN.read.gsub(/<h1>((.|\n)*)<\/h1>/i,"\\1")'

anonymous
(21.03.12 06:17:32 MSK)

Ответ на: комментарий от anonymous 21.03.12 06:17:32 MSK

grep умеет работать только построчно, т.е. если просто добавить «0 или более символов перевода строки» в regex, то это не сработает?

Frakhtan-teh ★★
(21.03.12 06:38:40 MSK) автор топика

Ответ на: комментарий от Frakhtan-teh 21.03.12 06:38:40 MSK

«0 или более символов перевода строки» в regex, то это не сработает?

Проверить же не сложно? Если фиксированы границы (регэксп не затрагивает промежуточные стороки), то можно обойтись: sed -n '/<h1>/,/<\/h1>/p'.

anonymous
(21.03.12 14:19:48 MSK)

Ссылка

Сначала объединить в одну строку, заменяя символы новой строки на пробелы.

// C. O.

~~r2d2~~
(21.03.12 16:05:47 MSK)

Ссылка

ет так делацца:

cat test|sed -n "{/Мой/N;/заголовок/p}"

yozan
(21.03.12 19:14:23 MSK)

Ответ на: комментарий от yozan 21.03.12 19:14:23 MSK

А объясните неграмотному, чем это лучше:

sed -n '/<h1>/,/<\/h1>/p'

anonymous
(21.03.12 21:33:17 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← VPN + autoconnect/reconnect

General

[feature request] Инфо про бинарники →

Похожие темы