sed и два пробела

sed

Есть код sed 's/\s[^$]/\\&/g'<<<"$VAR" — заменяет пробелы кроме пробела в конце строки на экранированные.
Проблема в том, что если где-то идёт 2 пробела, он один не экранирует. Как сделать, чтоб экранировал все?
И я даже не понимаю, почему он так делает.
Если без [^$] — то нормально. Но [^$] нужно.

Ссылка

← BIOS UEFI на ноутбуке

Grub и initrd на флешке →

← 1 2 →

Ответ на: комментарий от emulek 19.02.15 16:58:35 MSK

символы «\» и n матчатся

см. выше. Мы возвращаемся к тому, что 0x0A — это LF.

https://upload.wikimedia.org/wikipedia/commons/e/e0/ASCII_Code_Chart-Quick_re...

wakuwaku ★★★★
(19.02.15 17:12:37 MSK)

Ответ на: комментарий от wakuwaku 19.02.15 17:08:14 MSK

просто выполни echo БЕЗ sed. Можешь выхлоп загнать в hexdump.

emulek ★
(19.02.15 17:15:42 MSK)

Ответ на: комментарий от wakuwaku 19.02.15 17:08:14 MSK

упс, перепутал -e с -n :3

wakuwaku ★★★★
(19.02.15 17:16:16 MSK)

Ссылка

Ответ на: комментарий от emulek 19.02.15 17:15:42 MSK

Лучше объясни мне это:

~ $ echo -en '$$$$\n'>/tmp/tmp0002.tmp;sed 's/[^$]/Z/g' /tmp/tmp0002.tmp
$$$$                                                                                                                                                                                                               
                                                                                                                                                                                                                   
~ $

~ $ echo -en '$$$$\r\n'>/tmp/tmp0002.tmp;sed 's/[^$]/Z/g' /tmp/tmp0002.tmp                                                                                                                                          
$$$$Z                                                                                                                                                                                                              
                                                                                                                                                                                                                   
~ $

wakuwaku ★★★★
(19.02.15 17:17:55 MSK)
Последнее исправление: wakuwaku 19.02.15 17:20:01 MSK (всего исправлений: 2)

Ответ на: комментарий от wakuwaku 19.02.15 17:12:37 MSK

см. выше. Мы возвращаемся к тому, что 0x0A — это LF.

какая разница, что такое LF?

может у вас огрызко-проблемы, или шелло-проблемы, мне пофиг, у меня Linux и bash.

\n == EOL == LF == 0x0A

\r == CR == 0xOD

колись, что у тебя.

emulek ★
(19.02.15 17:20:04 MSK)

Ссылка

Ответ на: комментарий от wakuwaku 19.02.15 17:17:55 MSK

Лучше объясни мне это

мне отсюда не видно.

emulek ★
(19.02.15 17:21:24 MSK)

Ответ на: комментарий от emulek 19.02.15 17:21:24 MSK

~ $ echo -en '$$$$\r\n'|hexdump
0000000 2424 2424 0a0d                         
0000006
~ $ echo -en '$$$$\n'|hexdump
0000000 2424 2424 000a                         
0000005
~ $

0x0d матчится sed'ом как EOL, а 0x0a — нет? Какие-то шеллопроблемы. Припоминаю читал книжку, там написание шелла как раз рассматривалось, в том числе обработка спецсимволов и escape-последовательностей.

wakuwaku ★★★★
(19.02.15 17:25:54 MSK)
Последнее исправление: wakuwaku 19.02.15 17:27:10 MSK (всего исправлений: 2)

Ответ на: комментарий от wakuwaku 19.02.15 17:25:54 MSK

0x0d матчится sed'ом как EOL, а 0x0a — нет?

в Linux строчки принято заканчивать 0x0a (\n), а 0x0d (\r) — просто символ, невидимый, и на моём терминале работает как CR

$ echo -e 'ABCDEF\rXYZ'
XYZDEF

emulek ★
(19.02.15 17:50:09 MSK)

Ответ на: комментарий от emulek 19.02.15 17:50:09 MSK

на моём терминале

это и есть CR. Покажи echo -en '$$$$\r'>/tmp/tmp0002.tmp;sed 's/[^$]/Z/g' /tmp/tmp0002.tmp

wakuwaku ★★★★
(19.02.15 17:54:13 MSK)

Ответ на: комментарий от wakuwaku 19.02.15 17:54:13 MSK

$ echo -en '$$$$\r'>/tmp/tmp0002.tmp;sed 's/[^$]/Z/g' /tmp/tmp0002.tmp
$$$$Z

всё верно: \r это не доллар, и он матчится. И тут нет CR в выводе. На входе его тоже нет.

$ echo -e '$$$$\r'|sed 's/[^$]/Z/g'
$$$$Z

тоже самое, но красивее.

$ echo -e '$$$$\r\n\r'|sed 's/[^$]/Z/g'
$$$$Z
Z

как видишь, LF тут вообще в обработке не участвует, а напрямую едет на вывод.

$ echo -e '\n\n\r\n'|sed 's/[^$]/Z/g'


Z

emulek ★
(19.02.15 18:04:50 MSK)

Ответ на: комментарий от emulek 19.02.15 18:04:50 MSK

Твоя правда, наверное. Я под веществами. И эмм, мне было скучно, извини. :>

Так что, с \r это мои глюки, но \n sed всё же воспринимает как конец строки:

~ $  echo -en '$$$$\n\n\r\r11\n'|sed 's/$/Z/g'
$$$$Z
Z
11Z
~ $

Теперь можно обсудить то, что я сказал изначально, а именно \n преобразуется во вполне определённые байты, т.е. является спецсимволом (пусть и невидимым, но он там есть) LF, который нужно учитывать при разборе строк.

wakuwaku ★★★★
(19.02.15 18:23:03 MSK)
Последнее исправление: wakuwaku 19.02.15 18:23:36 MSK (всего исправлений: 1)

Ответ на: комментарий от wakuwaku 19.02.15 18:23:03 MSK

Я под веществами.

\n sed всё же воспринимает как конец строки

как ещё оно может воспринимать конец строки?

\n преобразуется во вполне определённые байты, т.е. является спецсимволом (пусть и невидимым, но он там есть) LF, который нужно учитывать при разборе строк.

в sed скрипте нельзя. Нет там такого символа. Я его юзаю как раз тогда, когда мне нужен какой-то маркёр, которого ТОЧНО не будет.

например:

$ echo "ABCDEFGH"|\
sed -r 's/^/\n/;s/$/\n/;bl;:l;s/(.*)(\n.)(.*)(.\n)(.*)/\1\4\3\2\5/;tl;s/\n//g'
HGFEDCBA

разворот строки наоборот, попробуй «улыбоктебедедмакар» например.

emulek ★
(19.02.15 18:47:03 MSK)

Ответ на: комментарий от emulek 19.02.15 18:47:03 MSK

Ну вот это мне и хотелось выяснить, мог бы сразу так и сказать.

wakuwaku ★★★★
(19.02.15 18:58:54 MSK)

Ответ на: комментарий от wakuwaku 19.02.15 18:58:54 MSK

ну теперь изучай мой скрипт. Как изучишь — приходи ☺

emulek ★
(19.02.15 19:06:32 MSK)

Ссылка

18 февраля 2016 г.

удалите долбайобау

anonymous
(18.02.16 21:04:50 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

← BIOS UEFI на ноутбуке

General

Grub и initrd на флешке →

Похожие темы