[^$] матчится вторым пробелом, \s[^$] это как бы два символа: первый символ пробел, второй символ — любой, который не конец строки, в случае с двумя пробелами второй пробел.

anarquista ★★★★★
(19.02.15 09:35:20 MSK)

Вероятно не объединяет, а экранирует только один. Надеюсь подсказка поможет понять.

Elyas ★★★★★
(19.02.15 09:38:45 MSK)

Ответ на: комментарий от anarquista 19.02.15 09:35:20 MSK

это понятно, но //& не подменяет же непробробел, идущий после пробела

teod0r ★★★★★
(19.02.15 09:45:49 MSK) автор топика

Тупой вариант решения: это сначала экранировать все пробелы, а потом разэкранировать последний:

sed 's/\s/\\&/g; s/\$(\s$$/\1/g'

anarquista ★★★★★
(19.02.15 09:46:41 MSK)

Ответ на: комментарий от Elyas 19.02.15 09:38:45 MSK

нет. именно объединяет. неэкранированного пробела не остаётся

teod0r ★★★★★
(19.02.15 09:47:18 MSK) автор топика

Ссылка

Ответ на: комментарий от anarquista 19.02.15 09:46:41 MSK

потом разэкранировать последний

как вариант сойдёт. благодарю
но причину происходящего тоже понять хочется

teod0r ★★★★★
(19.02.15 09:49:37 MSK) автор топика

Ответ на: комментарий от teod0r 19.02.15 09:45:49 MSK

Нет, & матчит именно два символа, пробел и идущий за ним любой символ, который не конец строки:

$ echo 'Hello world ' | LANG=C sed 's/\s[^$]/A/g'
HelloAorld

и у меня два пробела последовательных пробела не объединяются в один:

$ echo 'Hello   world ' | LANG=C sed 's/\s[^$]/\\&/g'
Hello\  \ world

anarquista ★★★★★
(19.02.15 09:50:49 MSK)

Ответ на: комментарий от anarquista 19.02.15 09:50:49 MSK

странно. только что у себя проверил — в скрипте объединяются, а не в скрипте — нет, но второй остаётся не экранированным. странности

teod0r ★★★★★
(19.02.15 09:56:17 MSK) автор топика

Ответ на: комментарий от teod0r 19.02.15 09:56:17 MSK

а нет! действительно второй остаётся неэкранированным, просто в скрипте лишнее эхо было

teod0r ★★★★★
(19.02.15 10:11:14 MSK) автор топика

Ссылка

Ответ на: комментарий от teod0r 19.02.15 09:49:37 MSK

но причину происходящего тоже понять хочется

проблема в [[^$]], которое матчится с «не $».

emulek ★
(19.02.15 10:45:40 MSK)

Ответ на: комментарий от emulek 19.02.15 10:45:40 MSK

ну и что делать? ведь если после пробела — не пробел, а какой-то другой символ, оно же нормально срабатывает. до конца не понятно же. то что дело в [^$] я и так понял

teod0r ★★★★★
(19.02.15 11:05:12 MSK) автор топика

Ответ на: комментарий от teod0r 19.02.15 11:05:12 MSK

ты лучше рассказывай, ЧТО ты хочешь получить от [^$] ?

А то я этого не понимаю, прост о тупо «мне не нравится! А-А-А!!!». Это овуляшки.ру?

emulek ★
(19.02.15 11:11:11 MSK)

% cat wowSpaces
  q w edddascxzc  # <-- тут пробел в конце
% perl -i -lpe 's/\s(?<!$)/\\&/g' testSpaces
% cat testSpaces
\&\&q\&w\&edddascxzc

anonymous
(19.02.15 11:14:49 MSK)

Ответ на: комментарий от emulek 19.02.15 11:11:11 MSK

ну что от [^$] нужно получить — писал: заэкранировать пробелы, кроме пробела в конце строки

teod0r ★★★★★
(19.02.15 11:16:03 MSK) автор топика

Ссылка

Ответ на: комментарий от anonymous 19.02.15 11:14:49 MSK

В первом cat «wowSpaces», но это был бэкапный файл.

anonymous
(19.02.15 11:23:02 MSK)

Ссылка

заменяет пробелы кроме пробела в конце строки на экранированные.

это POSIX регулярками сделать нельзя.

можно тремя:

echo "A B C " | sed 's/ $/\n/;s/ /☣/g;s/\n/¨/'

POSIX регулярки не умеют убирать критерии, только вставлять новые. Т.е. тебе надо что-то вроде " «AND(NOT$). Но есть только OR (|скобки|).

emulek ★
(19.02.15 11:32:15 MSK)

Ответ на: комментарий от emulek 19.02.15 11:32:15 MSK

я всё-равно не понимаю, почему если после пробела — пробел, оно не обрабатывает оба пробела нормально. ведь если после пробела — не пробел, то пробел нормально экранируется

teod0r ★★★★★
(19.02.15 11:43:35 MSK) автор топика

Ответ на: комментарий от anonymous 19.02.15 11:14:49 MSK

жаль, что sed не умеет 'look-behind' 'look-forward'.

teod0r ★★★★★
(19.02.15 11:45:52 MSK) автор топика

awk используй

~~darkenshvein~~ ★★★★★
(19.02.15 11:48:02 MSK)

Ответ на: комментарий от darkenshvein 19.02.15 11:48:02 MSK

не знаю как на авке сделать

teod0r ★★★★★
(19.02.15 11:50:31 MSK) автор топика

Ссылка

Ответ на: комментарий от teod0r 19.02.15 11:45:52 MSK

Поэтому и посвятил немного времени тому, как с perl заменить awk/sed. Всё равно, он есть почти на всех системах, что я использую (нету всякой макрухи с минимальными окружениями). Плюс в grep есть -P.
// Помимо всего прочего sed regex делают мне больно.

anonymous
(19.02.15 11:56:37 MSK)

Ссылка

Ответ на: комментарий от teod0r 19.02.15 11:43:35 MSK

Команда s/regexp/replacement/g заменяет часть строки, которая соответствует regexp, строкой replacement и идёт дальше; та часть строки, в которой производилась замена, повторно не рассматривается.

Регулярное выражение \s[^$] всегда соответствует двум символам. Первый символ пробельный, второй — любой, кроме конца строки.

В том случае, если идут два пробела подряд, то они два соответствуют этому регулярному выражению, происходит замена: перед ним ставится \. Команда s идёт дальше, при этом команда считает, что второй пробел уже обработан, ведь он входил в ту часть строки, которая соответствовала регулярному выражению и была заменена.

anarquista ★★★★★
(19.02.15 12:04:19 MSK)

Ответ на: комментарий от teod0r 19.02.15 11:43:35 MSK

я всё-равно не понимаю, почему если после пробела — пробел, оно не обрабатывает оба пробела нормально. ведь если после пробела — не пробел, то пробел нормально экранируется

Потому что для двух пробелов надо не вставить слеш перед найденным соответствием, а ещё и вставить слеш в середину. А обрабатывается именно соответствие из двух символов, а не единственный пробел

Elyas ★★★★★
(19.02.15 12:04:35 MSK)

Ссылка

Ответ на: комментарий от anarquista 19.02.15 12:04:19 MSK

та часть строки, в которой производилась замена, повторно не рассматривается

теперь понятно

teod0r ★★★★★
(19.02.15 12:30:54 MSK) автор топика

Ссылка

Ответ на: комментарий от teod0r 19.02.15 11:45:52 MSK

жаль, что sed не умеет 'look-behind' 'look-forward'.

это не баг, а фича.

Кстати, можешь скачать сырцы и сам собрать с какими-то параметрами. И будут у тебя PCRE в sed.

emulek ★
(19.02.15 12:40:27 MSK)

Ссылка

Ответ на: комментарий от anarquista 19.02.15 12:04:19 MSK

Первый символ пробельный, второй — любой, кроме конца строки.

нет

$ echo '123'|sed 's/./ /'|sed 's/[^$]/Z/g'
ZZZ

[^$] это «не доллар$» один пробел у тебя не заменился т.к. пробел — не доллар, но надо два пробела(пробел и не доллар). У тебя там всего один.

emulek ★
(19.02.15 12:48:17 MSK)

Ответ на: комментарий от emulek 19.02.15 12:48:17 MSK

ZZZ

а почему так? не понял. разве не должен был только 2 заменить на Z?

teod0r ★★★★★
(19.02.15 13:06:16 MSK) автор топика

Ответ на: комментарий от teod0r 19.02.15 13:06:16 MSK

Последняя Z не конец строки. Это просто Z. А конец, строки $.

anonymous
(19.02.15 13:13:08 MSK)

Ответ на: комментарий от anonymous 19.02.15 13:13:08 MSK

% echo "wow" | sed -e 's/$/[I am the end]/'
wow[I am the end]

anonymous
(19.02.15 13:14:33 MSK)

Ссылка

Ответ на: комментарий от anonymous 19.02.15 13:13:08 MSK

я думал [^$] означает "следующий символ не является концом строки". перепутал с 'look-forward'

teod0r ★★★★★
(19.02.15 13:18:02 MSK) автор топика
Последнее исправление: teod0r 19.02.15 13:21:32 MSK (всего исправлений: 1)

Ответ на: комментарий от anonymous 19.02.15 13:13:08 MSK

Последняя Z не конец строки.

Z это символ, а $ это место.

ОК, как ты это объяснишь

$ echo '$$$$'|sed 's/[^$]/Z/g'
$$$$

ы?

emulek ★
(19.02.15 13:20:40 MSK)

Ответ на: комментарий от teod0r 19.02.15 13:18:02 MSK

я думал [^$] означает «следующий символ не является концом строки»

не означает. Внутри [скобок] свои правила.

emulek ★
(19.02.15 13:21:43 MSK)

Ссылка

Ответ на: комментарий от emulek 19.02.15 13:20:40 MSK

ы?

sed не понимает?

teod0r ★★★★★
(19.02.15 13:25:22 MSK) автор топика

Ответ на: комментарий от teod0r 19.02.15 13:25:22 MSK

моя понимает, причём по-моему.

и да, хватит уже

man 7 regex

Obsolete («basic») regular expressions differ in several respects. '|', '+', and '?' are ordinary characters and there is no equivalent for their functionality. The delimiters for bounds are «\{» and «\}», with '{' and '}' by themselves ordinary characters. The parentheses for nested subexpressions are «$» and «$», with '(' and ')' by themselves ordi‐ nary characters. '^' is an ordinary character except at the beginning of the RE or(!) the beginning of a parenthesized subexpression, '$' is an ordinary characterexcept at the end of the RE or(!) the end of a parenthesized subexpression, and '*' is an ordinary character if it appears at the beginning of the RE or the beginning of a parenthesized subexpres‐ sion (after a possible leading '^').

emulek ★
(19.02.15 13:40:47 MSK)

Ответ на: комментарий от emulek 19.02.15 13:20:40 MSK

Короч, понял, что тупой прост. В данном случае [] — character class. В нём не работают в качестве $, ^ anchors.
А ступил из-за предплоложения, что исходный примере

echo ' ' | sed 's/[^$]/Z/g'

таки отработал и осоноваясь на версии teod0r решил объяснить ему.
И если следовать логике мой пример должен быть таким:

% echo '123' | sed 's/[$]/хуй а не конец строки/g'
123

Сорь.

anonymous
(19.02.15 14:21:49 MSK)

Ответ на: комментарий от anonymous 19.02.15 14:21:49 MSK

sed и два пробела (комментарий)

Yep. Вот я про это же.

anonymous
(19.02.15 14:24:28 MSK)

Ссылка

Ответ на: комментарий от emulek 19.02.15 13:40:47 MSK

В данном случае [] — character class.

угу, там ^ работает как отрицание (в начале класса).

вот-бы ещё замутили такую ерунду в подвыражениях, было-бы хорошо.

emulek ★
(19.02.15 14:32:01 MSK)

Ссылка

Ответ на: комментарий от emulek 19.02.15 13:20:40 MSK

ok

$ это место

~ $ echo '$$$$\n'|sed 's/[^$]/Z/g'
$$$$ZZ

wakuwaku ★★★★
(19.02.15 14:50:18 MSK)
Последнее исправление: wakuwaku 19.02.15 14:51:52 MSK (всего исправлений: 1)

Ответ на: ok от wakuwaku 19.02.15 14:50:18 MSK

и что?

emulek ★
(19.02.15 14:59:26 MSK)

Ответ на: ok от wakuwaku 19.02.15 14:50:18 MSK

% echo '$$$$\n'|sed 's/[^$]/Z/g'
$$$$

 % sed --version
sed (GNU sed) 4.2.2
...

anonymous
(19.02.15 15:02:28 MSK)

Ответ на: комментарий от emulek 19.02.15 14:59:26 MSK

неужели так сложно представить LF?

точно такой же символ

wakuwaku ★★★★
(19.02.15 15:02:39 MSK)

Ответ на: комментарий от anonymous 19.02.15 15:02:28 MSK

попробуй \r\n, или шелл фильтрует

wakuwaku ★★★★
(19.02.15 15:05:32 MSK)

Ответ на: комментарий от wakuwaku 19.02.15 15:02:39 MSK

неужели так сложно представить LF? точно такой же символ

во первых, у тебя _два_ символа: «\» и «n». Во вторых, \n это, по мнению sed, особый символ. В строках sed \n _никогда_ не бывает(если его ты сам не засадишь).

В третьих, что ты доказываешь? Что мне трудно представить LF?

emulek ★
(19.02.15 15:29:56 MSK)

Ответ на: комментарий от emulek 19.02.15 15:29:56 MSK

_два_
особый символ

противоречишь себе.

_никогда_ не бывает

всегда есть Ox0A(EOL, почти, но LF у нас), кроме случаев, когда там только одна строка с виртуальным EOF на конце. EOF — место, EOL — вполне себе символ, либо же последовательность оных.

wakuwaku ★★★★
(19.02.15 16:35:46 MSK)

Ответ на: комментарий от wakuwaku 19.02.15 16:35:46 MSK

противоречишь себе.

читать не умеешь? Повторю: в строках sed \n _никогда_ не бывает(если его ты сам не засадишь).

всегда есть Ox0A(EOL, почти, но LF у нас), кроме случаев, когда там только одна строка с виртуальным EOF на конце. EOF — место, EOL — вполне себе символ, либо же последовательность оных.

ты неадекватен. Я же сказал «в строках sed».

И ты ответил: что ты доказываешь?

emulek ★
(19.02.15 16:47:29 MSK)

Ответ на: комментарий от emulek 19.02.15 16:47:29 MSK

Sed получает строки из файлов, причём тут «строки sed»? Ты наркоман?

wakuwaku ★★★★
(19.02.15 16:48:52 MSK)
Последнее исправление: wakuwaku 19.02.15 16:49:53 MSK (всего исправлений: 1)

Ответ на: комментарий от wakuwaku 19.02.15 15:05:32 MSK

Не работает (

 % echo '$$$$\r\n'|sed 's/[^$]/Z/g'
$$$$

 %

anonymous
(19.02.15 16:51:08 MSK)

Ответ на: комментарий от wakuwaku 19.02.15 16:48:52 MSK

Sed получает строки из файлов, причём тут «строки sed»?

при том, что sed всегда грузит строку до EOL, потом обрабатывает, а потом выгружает.

Потому якорь $, это граница между последним символом и EOL. Сам EOL в строку сам никогда не попадает, потому что sed, как его встретит, так сразу начинает обрабатывать.

У меня

$ echo '$$$$\n'|sed 's/[^$]/Z/g'
$$$$ZZ

и тут нет ничего удивительного:

$ не матчится с [^$]

символы «\» и n матчатся, потому каждый символ меняется на Z. Получается $$$$ZZ.

И что?

emulek ★
(19.02.15 16:58:35 MSK)

Ответ на: комментарий от emulek 19.02.15 16:58:35 MSK

Хм, у меня zsh специфика была.

$ echo '$$$$\n'|sed 's/[^$]/Z/g'
$$$$ZZ

Понаставят всяких shell'ов, а потом толкуй с ними.

anonymous
(19.02.15 17:04:18 MSK)

Ссылка

Ответ на: комментарий от anonymous 19.02.15 16:51:08 MSK

У меня так:

~ % echo '$$$$\r\n'|sed 's/[^$]/Z/g'                                                                                                                                                                           [0]
$$$$Z

~ % echo '$$$$\n'|sed 's/[^$]/Z/g'                                                                                                                                                                             [0]
$$$$

~ % echo '$$$$\r'|sed 's/[^$]/Z/g'                                                                                                                                                                             [0]
$$$$Z
~ %                                                                                                                                                                                                            [0]

по кажется это фича zsh, он пытается быть eye candy

~ % echo -n '$$$$\r\n'>/tmp/tmp0002.tmp;sed 's/[^$]/Z/g' /tmp/tmp0002.tmp                                                                                                                                      [0]
$$$$Z
~ %

~ $ echo -n '$$$$\r\n'>/tmp/tmp0002.tmp;sed 's/[^$]/Z/g' /tmp/tmp0002.tmp
$$$$ZZZZ~ $

wakuwaku ★★★★
(19.02.15 17:08:14 MSK)

ok

Похожие темы