LINUX.ORG.RU

знатокам перла и регекспов, хелп плиз


0

0

Помогите пожалуйста. Борюсь с выводом из веб редактора.

Как одной регуляркой подрезать в html тексте все выражения типа <p align="left"></br> </p> учитывая что align может быть любой фразой а после </br> может быть любое количество пробелов? Что-то я уже совсем голову потерял.

anonymous

Ответ на: комментарий от anonymous

Блин, забыл сказать что там есть нормальные теги <p>some text</p> которые резать так раз не надо! Я пытаюсь очистить хтмл кусок от мусора, в данном случает от не несущих информацию <p><br> </p>

anonymous
()
Ответ на: комментарий от PoMbl4

Тысячу интернетов вам, уважаемый PoMbl4. Большое спасибо!

anonymous
()
Ответ на: комментарий от PoMbl4

Зря вы так. Жадность погубила много регэкспов :)

$str = q(AAA <p>some text BBB </p> CCC <p align="left"> </br> </p> DDD <p>some text</p> EEE <p align="left"> </br> </p> FFF);
$_ = $str; s/<p align=".*">\s*?<\/br>\s*?<\/p>//gi; print "$_\n";
$_ = $str; s/<p align=".*?">\s*?<\/br>\s*?<\/p>//gi; print "$_\n";
$_ = $str; s/<p align="\w*">\s*?<\/br>\s*?<\/p>//gi; print "$_\n";

Даёт:

AAA <p>some text BBB </p> CCC FFF
AAA <p>some text BBB </p> CCC DDD <p>some text</p> EEE FFF
AAA <p>some text BBB </p> CCC DDD <p>some text</p> EEE FFF

alexsaa
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.