Как использовать переменную в регулярном выражении?

0

1

Привет друзья. Имеется регулярное выражение в команде вида:

echo 'hello world' | grep -oP 'hello \K(world)'

Как сделать, чтобы в регулярном выражении вместо текста hello я мог использовать переменную $hello? Т.к. если подставлять переменную вместо текста, то регулярное выражение перестаёт работать.

Ссылка

← SIP over OpenVPN. Не подключается

Exim4 - проблема с Заглавными Буквами в email →

echo ‘hello world’ | grep -oP "${hello} \K(world)"

dexpl ★★★★★
(05.04.21 10:32:20 MSK)

Ссылка

Чтобы результатом пайпа была какая-то строка, нужно чтобы переменная $hello содержала какую-то подстроку из строки hello world. Тогда пример @dexpl будет работать.

kardjoe
(05.04.21 10:38:41 MSK)
Последнее исправление: kardjoe 05.04.21 10:38:52 MSK (всего исправлений: 1)

Ссылка

А вообще, в bash есть встроенный regex, для которого не обязательно вызывать нестандартизированный perl-regex в grep. И сразу получим результат в переменной и без всяких пайпов.

$ hello=XXX
$ [[ "XXX world" =~ "$hello "([[:alnum:]]*) ]]
$ echo ${BASH_REMATCH[1]}
world

vodz ★★★★★
(05.04.21 11:20:48 MSK)

Ответ на: комментарий от vodz 05.04.21 11:20:48 MSK

на UNIX System V Release 3.2 нет bash, не портабельно

anonymous
(05.04.21 11:23:07 MSK)

Ответ на: комментарий от anonymous 05.04.21 11:23:07 MSK

на UNIX System V Release 3.2 нет bash, не портабельно

У человека есть ТЗ, написать на bash. В современном мире если нет bash-а, то либо его поставят, либо такое ТЗ не будет. А вот grep-а с pcre надо оговаривать отдельно. ТС вроде уже третий топик создаёт на эту задачу, отказывающийся от правильного ответа, заключающегося в том, что если надо разбивать на слова (см его regex), то для этого изобретен awk, где нет проблем с переменными и прочими вычислениями третьего слова (см соседний топик). Упорно талдычит свой grep. Ну так пусть и пишет, что в задаче стоит не bash, а как сделать только на основе grep.

vodz ★★★★★
(05.04.21 11:32:05 MSK)

Ответ на: комментарий от vodz 05.04.21 11:32:05 MSK

Спасибо за помощь и внимание к моей проблеме. Указанное регулярное выражение я использую чтобы оставить текст только между определёнными символами. Допустим у меня строка в которой надо оставить только текст между символами W и Y, можете подсказать как это более эффективно реализуется через awk?

dualCore
(05.04.21 17:28:51 MSK) автор топика

Ответ на: комментарий от dualCore 05.04.21 17:28:51 MSK

Допустим у меня строка

У вас ровно одна строка или целый файл на входе и соответственно на выходе?

в которой надо оставить только текст между символами W и Y

Это уникальные символы в строке?

vodz ★★★★★
(05.04.21 18:39:58 MSK)

Ответ на: комментарий от vodz 05.04.21 18:39:58 MSK

На входе у меня набор текста, чаще всего это код веб страницы. На выходе у меня строка или несколько строк, из которых отсеян ненужный текст. Вот самая первая моя задача для которой мне как раз и подсказали решение с pcre
Задача получить в bash вывод со страницы https://www.postgresql.org/ftp/source/ , где содержались только бы номера версий ПО и ничего более.
Вот так я решаю эту задачу: curl -s https://www.postgresql.org/ftp/source/ | grep -Po 'alt=«v\K.*?(?=»)'
Т.е. оставляю только вывод который находится между alt=«v и » Как вы предлагаете решать такие задачи через awk?

dualCore
(05.04.21 20:00:56 MSK) автор топика

Ответ на: комментарий от dualCore 05.04.21 20:00:56 MSK

где содержались только бы номера версий ПО и ничего более.

Так что ли?

curl -s https://www.postgresql.org/ftp/source/ | grep -o 'href="v[0-9.]\+/"' | grep -o 'v[0-9.]\+'

wandrien ★★★★
(05.04.21 20:08:38 MSK)

Ссылка

Ответ на: комментарий от dualCore 05.04.21 20:00:56 MSK

Логичнее взять инструмент для xml/html, и работать с XPath.

К примеру xpup или xmllint.

На самом деле куда лучше взять тот же python, но если именно shell нужен то специализированная утилита спасёт от кучи неведомых багов.

WoozyMasta ★
(05.04.21 20:09:25 MSK)

Ссылка

Ответ на: комментарий от dualCore 05.04.21 20:00:56 MSK

На входе у меня набор текста, чаще всего это код веб страницы.

Не надо вилять. html — совсем другое дело.

Как вы предлагаете решать такие задачи через awk?

Берете на слабо? Да нате.

curl -s https://www.postgresql.org/ftp/source/ | xmllint --html --xpath html/body/div/div/div/div/div/table/tr/td  - 2> /dev/null | awk  -vRS='>' '$1=="<a" && /href=.?v[0-9.]+\// { v=gensub(/href=.?(v[0-9.]+)\/.*/, "\\1", "g", $2); if(va[v]==0) { va[v]=1; print v;} }'

vodz ★★★★★
(05.04.21 22:12:58 MSK)

Ответ на: комментарий от vodz 05.04.21 22:12:58 MSK

Парсинг XMLя регуляркой сразу после примения XPath? Осталось всунуть это в продакшн, написать немного лирики и можно слать в TheDailyWTF.

t184256 ★★★★★
(06.04.21 02:52:22 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← SIP over OpenVPN. Не подключается

Admin

Exim4 - проблема с Заглавными Буквами в email →

Похожие темы