Криво обрабатывается простая регулярка в JavaScript

0

1

Вот простой пример:

text="<span class="bold js-clone-url-permission">Read+Write</span> access";
searchPattern="(.*)";
replacePattern="До $1 После";
      
result=text.replace(new RegExp(searchPattern,'g'), replacePattern);

Результат:

До <span class="bold js-clone-url-permission">Read+Write</span> access ПослеДо  После

Вопрос: Почему До После попадает в результат дважды?

Проверено на Firefox 14, Opera 12.

Ссылка

←	редактор таблиц в SQLite

PHP: операторы сравнения и назначения

→

А если "(.*)$" ?

Или "(.+)"

note173 ★★★★★
(27.07.12 01:48:30 MSK)
Последнее исправление: note173 27.07.12 01:49:17 MSK (всего исправлений: 1)

Ответ на: комментарий от note173 27.07.12 01:48:30 MSK

С (.+) отрабатывает правильно.

Но таки (.*) - это одно вхождение, на то и скобки.

Чего это яваскрипт лепит еще одну строку справа?

Xintrea ★★★★★
(27.07.12 01:55:15 MSK) автор топика

Ссылка

Ответ на: комментарий от note173 27.07.12 01:48:30 MSK

Все я спать, задрали меня регулярки. То одно не работает, то другое глючит.

Xintrea ★★★★★
(27.07.12 01:56:46 MSK) автор топика

Ссылка

а без «g»?

GateKeeper ★★
(27.07.12 11:19:04 MSK)

Ответ на: комментарий от GateKeeper 27.07.12 11:19:04 MSK

Вот что меня смешит в луноходах, так это то что вместо понимания как оно работает, люди тупо перебирают варианты «а что будет если?».

Xintrea ★★★★★
(27.07.12 11:23:35 MSK) автор топика

Ответ на: комментарий от Xintrea 27.07.12 11:23:35 MSK

Ой, нуб меня затроллировал! Иди читай референс по жабаскрипту (да и PCRE вообще), особенно про модификатор 'g'.

GateKeeper ★★
(27.07.12 11:26:26 MSK)

Ссылка

Проблема в g шаблон захватывает всю строку - это первая часть а потом ещё обрабатывает конец строки ($) - это вторая пустая часть

anonymous
(27.07.12 13:04:46 MSK)

Ответ на: комментарий от anonymous 27.07.12 13:04:46 MSK

Проблема в g шаблон захватывает всю строку - это первая часть а потом ещё обрабатывает конец строки ($) - это вторая пустая часть

Ну так в шаблоне же нету $ чтоб конец строки захватывать.

Я конечно могу воспользоваться (.+), оно эту вашу виртуальную вторую пустую часть не захватит. Я другого не могу понять - с какого перепугу конец строки стал отдельной «частью», чтобы ее обрабатывать? Что вообще подразумевается под понятием «конец строки»? Символов перевода строки/возврата каретки в исходной строке нет. Неужели символ завершения строки (типа нуль?) образует «вторую пустую чать строки»? И вообще символ завершения строки к строке никакого отношения к строке иметь не должен. Ведь, образно говоря, существуют строки без символа конца строки, когда хранится её длина.

Повторю вопрос: откуда берется «вторая пустая часть» в строке? Где она находится? После последнего символа чтоли? А почему не перед первым, если на то пошло?

Xintrea ★★★★★
(27.07.12 13:59:09 MSK) автор топика

Ответ на: комментарий от Xintrea 27.07.12 13:59:09 MSK

Смотри — сначала lastIndex (положение матчера в строке) регулярного выражения равен 0. Дальше replace матчит паттерн со строкой text целиком — длиной, скажем (лень считать), в 100 символов. Это первое совпадение. Теперь lastIndex равен 100 и совпадает с длиной строки. lastIndex может совпадать с длиной строки (чтобы .* соответствовал пустой строке, например), но не может быть больше ее. Теперь паттерн .* соответствует пустой строке на конце text — у нас есть второе совпадение. Увидев, что lastIndex не изменился (т.к. размер совпадения = 0), replace самостоятельно увеличивает его на единицу (в противном случае метод бы сваливался в бесконечный цикл). Теперь lastIndex > длины строки и процесс замены завершается.

А почему не перед первым, если на то пошло?

Потому что .* — жадный паттерн, он сразу пытается захватить настолько много символов, насколько возможно. Если же использовать ленивый паттерн .*?, то match найдет по одному пустому совпадению в каждом символе строки и одно — в конце строки.

trycatch ★★★
(27.07.12 15:15:42 MSK)

Ответ на: комментарий от trycatch 27.07.12 15:15:42 MSK

От спасибо, хорошо объяснил. Правда, считаю что имхо это неправильное поведение с точки зрения человеческой логики. Паттерн (.*) должен находить вся строку и ничего более!

Кстате, у меня подозрение, что у тебя есть какая-то книга по регуляркам, которой нет у меня, либо ты заморачивался с реализацией вычислений регулярных выражений.

Xintrea ★★★★★
(27.07.12 15:43:35 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	редактор таблиц в SQLite

Web-development

PHP: операторы сравнения и назначения

→

Похожие темы