LINUX.ORG.RU
решено ФорумAdmin

Помощь с sed

 ,


0

1

Есть текстовый файл, в нем есть строка, содержащая кусок html кода. В нем есть тег <a>, у которого в качестве параметра есть href='<какой-то адрес>'. Нужно оставить только этот адрес. В sed и регулярных выражениях разбираюсь плохо. Заранее спасибо.

$ echo -e '<a>\n<href=«<какой-то адрес>»' |grep -P -o '<a>[^<]+<href=«[^»]+' |sed -r -n '/<href="([^«]+)/s//\1/p'
<какой-то адрес>
tides
()
Ответ на: комментарий от Kroz

Ну это уже мелочи, их сможет убрать и третьеклассник.

Debasher ★★★★★
()

еще вариант

cat file.html | awk -F'href="' '{for(i=2;i<=NF;i++){print $i}}' | awk -F'"' '{print $1}'

sdio ★★★★★
()
Ответ на: комментарий от Deleted
perl -E'undef$/;$_=<>;s/.*<a[^>]+href='\"([^'\"]+)'\".*/say $1/se'
AITap ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.