Плохой sed

0

0

$ echo «0Ffdsfdsfds 12212 ururu» | sed 's/^.*ururu/123/g'
123
$ echo «0йцукен 12212 ururu» | sed 's/^.*ururu/123/g'
0йцукен 12212 ururu

Где бы почитать как это лечится?

Ссылка

← Что это????

[копипаст][opennet]Google намерен вернуть в Linux-ядро код, разработанный для платформы Android →

megabaks@localhost ~ $ echo "0Ffdsfdsfds 12212 ururu" | sed 's/^.*ururu/123/g'
123
megabaks@localhost ~ $ echo "0йцукен 12212 ururu" | sed 's/^.*ururu/123/g'
123
megabaks@localhost ~ $

Ы?

megabaks ★★★★
(18.04.10 01:43:59 MSK)

Ссылка

[fjfalcon@desktop ~]$ echo "0йцукен 12212 ururu" | sed 's/^.*ururu/123/g'
123

странно, может в локале дело?

fjfalcon ★★★
(18.04.10 01:44:42 MSK)

Ответ на: комментарий от fjfalcon 18.04.10 01:44:42 MSK

Возможно, что и в локали, но вот где копать все-равно не пойму.

$ locale
LANG=ru_RU.UTF-8
LC_CTYPE="ru_RU.UTF-8"
LC_NUMERIC="ru_RU.UTF-8"
LC_TIME="ru_RU.UTF-8"
LC_COLLATE="ru_RU.UTF-8"
LC_MONETARY="ru_RU.UTF-8"
LC_MESSAGES="ru_RU.UTF-8"
LC_PAPER="ru_RU.UTF-8"
LC_NAME="ru_RU.UTF-8"
LC_ADDRESS="ru_RU.UTF-8"
LC_TELEPHONE="ru_RU.UTF-8"
LC_MEASUREMENT="ru_RU.UTF-8"
LC_IDENTIFICATION="ru_RU.UTF-8"
LC_ALL=

$ cat /etc/debian_version
5.0.4

z1pp3r
(18.04.10 01:48:07 MSK) автор топика

Ответ на: комментарий от z1pp3r 18.04.10 01:48:07 MSK

fjfalcon@server:~$ locale
LANG=ru_RU.UTF-8
LC_CTYPE="ru_RU.UTF-8"
LC_NUMERIC="ru_RU.UTF-8"
LC_TIME="ru_RU.UTF-8"
LC_COLLATE="ru_RU.UTF-8"
LC_MONETARY="ru_RU.UTF-8"
LC_MESSAGES="ru_RU.UTF-8"
LC_PAPER="ru_RU.UTF-8"
LC_NAME="ru_RU.UTF-8"
LC_ADDRESS="ru_RU.UTF-8"
LC_TELEPHONE="ru_RU.UTF-8"
LC_MEASUREMENT="ru_RU.UTF-8"
LC_IDENTIFICATION="ru_RU.UTF-8"
LC_ALL=
fjfalcon@server:~$ cat /etc/debian_version 
5.0.4
fjfalcon@server:~$ echo "0йцукен 12212 ururu" | sed 's/^.*ururu/123/g' 
123
fjfalcon@server:~$

Таки действительно странно... на обычном стейбле все отлично работает...

fjfalcon ★★★
(18.04.10 01:49:35 MSK)

Ответ на: комментарий от fjfalcon 18.04.10 01:49:35 MSK

таки ссзб - выставил в терминале кодировку кои8.
С йцукеном разобрался, вопрос 2:

$ LANG=ru_RU.koi8r curl <блаблабла> | | sed 's/^.*\]//g'

совершенно не работает. Текст на странице - кои8, и его сед упорно игнорирует

z1pp3r
(18.04.10 02:00:48 MSK) автор топика

Ответ на: комментарий от z1pp3r 18.04.10 02:00:48 MSK

пробел между | и |
и что значит игнорирует?

megabaks ★★★★
(18.04.10 02:14:30 MSK)

Ответ на: комментарий от megabaks 18.04.10 02:14:30 MSK

пробел между | и | - плохо скопипастил. там после curl'а еще греп, видимо от него подцепил.
А игнорирует - значит ведет себя так же как в первом посте

z1pp3r
(18.04.10 02:17:57 MSK) автор топика

Ответ на: комментарий от z1pp3r 18.04.10 02:17:57 MSK

конечно костыль... но можно выхлоп curl'a из koi8 в utf-8 перегонять.. а опасля sed'ом ;)

fjfalcon ★★★
(18.04.10 02:26:58 MSK)

Ответ на: комментарий от fjfalcon 18.04.10 02:26:58 MSK

Да, так тоже пробовал - получалось чтото типа

iconv: illegal input sequence at position 203

z1pp3r
(18.04.10 02:30:16 MSK) автор топика

Ответ на: комментарий от z1pp3r 18.04.10 02:30:16 MSK

/s/iconv/enconv ?

fjfalcon ★★★
(18.04.10 02:32:54 MSK)

Ответ на: комментарий от fjfalcon 18.04.10 02:32:54 MSK

Ну как curl снова наткнется на русские буквы(за неделю он, гад такой, первый раз их нашел) - попробую, спасибо.

z1pp3r
(18.04.10 02:41:12 MSK) автор топика

Ссылка

Ответ на: комментарий от z1pp3r 18.04.10 02:00:48 MSK

$ LANG=ru_RU.koi8r curl <блаблабла> | | sed 's/^.*\]//g'

AFAIU, в таком варианте LANG переопределяется только для curl'а, grep и sed работают с системной локалью. Нужно писать либо

export LANG=ru_RU.koi8r
curl | grep | sed

, либо

LANG=ru_RU.koi8r sh -c "curl | grep | sed"

dexpl ★★★★★
(18.04.10 03:17:52 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Что это????

Talks

[копипаст][opennet]Google намерен вернуть в Linux-ядро код, разработанный для платформы Android →

Похожие темы