Может лучше не использовать русский(и любой иной язык кроме английского) для работы в консоли?

torvn77 ★★★★★
(06.06.20 16:59:15 MSK)
Последнее исправление: torvn77 06.06.20 17:00:04 MSK (всего исправлений: 1)

Это реакция не на «Л», а на заглавную в принципе. Попробуй ENG получишь то же. Почему – я не в курсе. Кто-то видимо или говна пожрал или IBM-вирус какой цепанул…

P.S.: хотя нет. Но вообще такое уже видел и не только для «Л». Но сейчас могу только для заглавной «Л» найти пример. Странно это всё.

P.P.S.:

   8542 pts/0    T      0:00 nano -w АБВГДЕЁЖЗИЙК?МНОПРСТУФХЦЧШЩЪЫЬЭЮЯфбвгдеёжзийклмнопрстуфхцчшщъыьэюя

и

8567 pts/0    T      0:00 nano -w ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz

и, на последок, с ударением

nano -w LÓR &
# 8622 pts/0    T      0:00 nano -w LO?R

~~kostyarin_~~ ★★
(06.06.20 17:00:24 MSK)
Последнее исправление: kostyarin_ 06.06.20 17:08:50 MSK (всего исправлений: 2)

Ответ на: комментарий от torvn77 06.06.20 16:59:15 MSK

Может лучше не использовать русский(и любой иной язык кроме английского) для работы в консоли?

Да почему бы и нет?

кошка мультифора.тээкстэ | гребёнка "Лето"

~~kostyarin_~~ ★★
(06.06.20 17:11:13 MSK)

Ответ на: комментарий от torvn77 06.06.20 16:59:15 MSK

Тогда уж лучше только цифрами пользоваться. Имена файлов, увы, /home/user/pix/Лютик.jpg, /home/user/pix/Лилия.jpg и т.д. Требуется найти открытые файлы с этими именами и закрыть их. Не нашел ничего лучше как ps axww | grep «$filename», а потом kill их.

novus ★★
(06.06.20 17:13:11 MSK) автор топика

«Л» в UTF-8 кодируется байтами 0xd0 0x9b. ps из procps «на всякий случай» защищается от 0x9b, потому что боится, что терминал может воспринять 0x9b как однобайтный CSI, и поэтому заменяет любую кодовую последовательность с 0x9b на ‘?’.

i-rinat ★★★★★
(06.06.20 17:13:25 MSK)

Ответ на: комментарий от kostyarin_ 06.06.20 17:00:24 MSK

LÓR

0x4c 0x4f 0xcc 0x81 0x52

COMBINING ACUTE ACCENT, то есть U+0301, не является печатным символом, и ps заменяет его на ?. Вот так вот он (не) поддерживает юникод: обрабатывает кодовые позиции по одной за раз.

i-rinat ★★★★★
(06.06.20 17:19:17 MSK)

Ответ на: комментарий от i-rinat 06.06.20 17:13:25 MSK

procps не видит, что в системе локаль с UTF-8? 0x9b же некорректная последовательность.

gedisdone ★★★
(06.06.20 17:19:36 MSK)

Ответ на: комментарий от kostyarin_ 06.06.20 17:11:13 MSK

мультифора

Ясно, понятно.

~~EXL~~ ★★★★★
(06.06.20 17:20:51 MSK)

Ссылка

Ответ на: комментарий от gedisdone 06.06.20 17:19:36 MSK

Видит. Более того, вся эта замена делается только для локалей с UTF-8. Забавно, да?

Как я уже сказал, это какая-то защита от терминалов, которые ломаются от 0x9b. Бредовенько, да.

А, да. Ему не надо, чтобы последовательность начиналась на 0x9b. Он смотрит во все байты.

i-rinat ★★★★★
(06.06.20 17:20:54 MSK)
Последнее исправление: i-rinat 06.06.20 17:21:43 MSK (всего исправлений: 1)

Ответ на: комментарий от novus 06.06.20 17:13:11 MSK

Имена файлов, увы, /home/user/pix/Лютик.jpg,

Такого рода файлы обычно через консоль не перерабытываются.

Хотя да, помимо изображений есть ещё и произведения литературы, но их может правильнее хранить в специальной индексированной БД?

torvn77 ★★★★★
(06.06.20 17:21:07 MSK)

Ответ на: комментарий от i-rinat 06.06.20 17:19:17 MSK

Простите

CSI

CRIME SCENE INVESTIGATION?

novus ★★
(06.06.20 17:23:53 MSK) автор топика

Ответ на: Простите от novus 06.06.20 17:23:53 MSK

Control Sequence Introducer

i-rinat ★★★★★
(06.06.20 17:27:09 MSK)

Ссылка

Ответ на: комментарий от torvn77 06.06.20 17:21:07 MSK

Они хранятся просто в текстовом файле, и если есть процесс открывший один из файлов, то надо его закрыть. Слайдшоу такое.

novus ★★
(06.06.20 17:31:03 MSK) автор топика

Ссылка

Ответ на: комментарий от i-rinat 06.06.20 17:20:54 MSK

Спасибо за разъяснение, мастерски.

Наверное, нужно все (вывод ps и имена фалов) перекодировать в не UTF-8, но что-то мне подсказывает, что будут проблемы. Или, проще, реализовать кастомное сравнение строк, учитывая 'Л' - это '?'.

novus ★★
(06.06.20 17:43:07 MSK) автор топика

Ответ на: комментарий от novus 06.06.20 17:43:07 MSK

Лучшим решением тут будет запатчить ps, чтобы он такого экранирования больше не делал. В нём нет смысла, потому что если терминал ломается от «Л», проблемы с ps будут не самой главной заботой пользователя. Этому коду пятнадцать лет. Его как добавили, так больше и не трогали. Видимо, пришло время.

i-rinat ★★★★★
(06.06.20 17:45:58 MSK)

Arch Linux

$ nano -w лето &

[1] 410029[br]

[2] 410030[br]

$ ps axww | grep 410029

user 410029 0.0 0.0 9932 3488 pts/1 T 16:36 0:00 _ nano -w лето

user 410119 0.0 0.0 9148 2296 pts/1 S+ 16:37 0:00 _ grep 410029

$ locale

LANG=pl_PL.UTF-8

LC_CTYPE=«pl_PL.UTF-8»

LC_NUMERIC=pl_PL.UTF-8

LC_TIME=pl_PL.UTF-8

LC_COLLATE=«pl_PL.UTF-8»

LC_MONETARY=pl_PL.UTF-8

LC_MESSAGES=«pl_PL.UTF-8»

LC_PAPER=pl_PL.UTF-8

LC_NAME=pl_PL.UTF-8

LC_ADDRESS=pl_PL.UTF-8

LC_TELEPHONE=pl_PL.UTF-8

LC_MEASUREMENT=pl_PL.UTF-8

LC_IDENTIFICATION=pl_PL.UTF-8

LC_ALL=

diatryba
(06.06.20 17:58:30 MSK)

Ответ на: Arch Linux от diatryba 06.06.20 17:58:30 MSK

Л<>л

novus ★★
(06.06.20 18:00:23 MSK) автор топика

Ответ на: комментарий от novus 06.06.20 18:00:23 MSK

Вы правы, разница есть:

nano -w Лето &nano -w Лето &

[3] 412107

[4] 412108

$ ps axww | grep 412107

user 412107 0.0 0.0 9932 3400 pts/1 T 16:59 0:00 _ nano -w ?ето

user 412155 0.0 0.0 9148 2216 pts/1 S+ 17:00 0:00 _ grep 412107

diatryba
(06.06.20 18:05:06 MSK)

Ответ на: Вы правы, разница есть: от diatryba 06.06.20 18:05:06 MSK

Польский язык отображается хорошо:

$ nano -w Lato &

[5] 426856

$ ps axww | grep 426856

user 426856 0.0 0.0 9932 3492 pts/1 T 17:07 0:00 _ nano -w Lato

user 426894 0.0 0.0 9148 2296 pts/1 S+ 17:07 0:00 _ grep 426856

diatryba
(06.06.20 18:11:58 MSK)

Ответ на: комментарий от torvn77 06.06.20 17:21:07 MSK

Мысль дельная, спасибо. Храниться будут pid'ы. Только это будет только те процессы, которые сам открываешь.

novus ★★
(06.06.20 18:32:24 MSK) автор топика

Ответ на: комментарий от novus 06.06.20 18:32:24 MSK

Мысль дельная, спасибо.

Файловая система и есть БД. Так что мысль так себе. Если есть проблема использования отличного от английского строчного беспробельного бесдефисного бездиакритического (и т.д. и т.д.п.), то решать нужно её, а не придумывать какую-то херню.

~~kostyarin_~~ ★★
(06.06.20 18:33:05 MSK)

Патчить здесь

https://gitlab.com/procps-ng/procps/-/blob/master/proc/escape.c#L103

~~kostyarin_~~ ★★
(06.06.20 18:36:44 MSK)

Issue: https://gitlab.com/procps-ng/procps/-/issues/176

~~kostyarin_~~ ★★
(06.06.20 18:49:19 MSK)

Ссылка

Ответ на: Польский язык отображается хорошо: от diatryba 06.06.20 18:11:58 MSK

Интересно, что htop показывает Л правильно:

https://paste.pics/98DVL

diatryba
(06.06.20 18:55:14 MSK)

Ссылка

Ответ на: комментарий от torvn77 06.06.20 16:59:15 MSK

А может лучше сразу и английский не использовать - тупо пойти смотреть мемасы и лайки в инсте ставить ? Хотя действительно кому вообще сдался этот родной язык, может ещё и маму с папой людить и уважать прикажете….

AKonia ★★★
(06.06.20 19:52:23 MSK)

Ответ на: комментарий от AKonia 06.06.20 19:52:23 MSK

Неосилятор единственно полезного детектед.

t184256 ★★★★★
(06.06.20 19:54:58 MSK)

Ссылка

Ответ на: комментарий от i-rinat 06.06.20 17:13:25 MSK

ох уж эти юниксвейные легаси костыли…

anonymous
(06.06.20 19:58:37 MSK)

Ссылка

Ответ на: комментарий от torvn77 06.06.20 17:21:07 MSK

Такого рода файлы обычно через консоль не перерабытываются.

только на щвятом жападе умеют не мышевозить?

хранить в специальной индексированной БД?

линупсовые фс настолько не годны для хранения файлов?

anonymous
(06.06.20 20:01:36 MSK)

Ссылка

Ответ на: комментарий от i-rinat 06.06.20 17:20:54 MSK

$ nano -w Лето &
[1] 18883
$ ps -ef | grep 18883
210409 18883 18716   0  9:37PM ttys000    0:00.01 nano -w Лето

А на маке защиты нету получается. Как теперь жить?

~~lua~~
(06.06.20 21:40:52 MSK)

Ответ на: комментарий от torvn77 06.06.20 16:59:15 MSK

Не держите его таким образом, ага.

~~lua~~
(06.06.20 21:42:13 MSK)

Ссылка

Ответ на: комментарий от lua 06.06.20 21:40:52 MSK

на маке

Как теперь жить?

С важностью и чувством презрения к простым смертным.

i-rinat ★★★★★
(06.06.20 21:50:31 MSK)

Ответ на: комментарий от kostyarin_ 06.06.20 18:36:44 MSK

Патчить здесь

Где патч?

anonymous
(06.06.20 21:56:59 MSK)

Ответ на: комментарий от AKonia 06.06.20 19:52:23 MSK

Хотя действительно кому вообще сдался этот родной язык

Всё проще: национальный язык это практическая эксплуатация ОС пользователем под гуем и там национальный язык дейсьвительно нужен, а консоль она не для повседневной жизни, она для администрирования, конфигурирования и отладки приложений и это лучше делать на едином для всего мира языке, другие языки приведут только к усложнению кода, распылению усилий и путанице.

П.С. Но конечно баг с заглавными буквами следует исправить.

torvn77 ★★★★★
(06.06.20 22:34:51 MSK)
Последнее исправление: torvn77 06.06.20 22:37:34 MSK (всего исправлений: 2)

Ответ на: комментарий от anonymous 06.06.20 21:56:59 MSK

Где патч?

Сам не могёшь, чтоле? %/

anonymous
(06.06.20 22:45:37 MSK)

Ответ на: комментарий от anonymous 06.06.20 21:56:59 MSK

Где патч?

Если по-пацански делать, то сначала обсудить надо. Порешать. Там, «за», «против» взвесить и так далее.

~~kostyarin_~~ ★★
(06.06.20 23:09:17 MSK)

Ссылка

Ответ на: комментарий от i-rinat 06.06.20 21:50:31 MSK

мак

С важностью и чувством презрения к простым смертным.

Система, кстати, довольно тупая. Особенно терминал после Linux-а. Home/End по строке не работают. Что там у них за сочетания вместо этого (а главное зачем) не понятно. Ну и так далее.

~~kostyarin_~~ ★★
(06.06.20 23:13:56 MSK)
Последнее исправление: kostyarin_ 06.06.20 23:22:55 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от torvn77 06.06.20 22:34:51 MSK

другие языки приведут только к усложнению кода

Для C/C++ говна да. А вообще, сейчас уже поддержка UTF-8/16/32 в языке считается нормой. Иными словами, старый хлам поддерживать хлопотней. Это да.

Только проблема не в хламе, а в ЯП, на котором они написаны. Удивительный кульбит Уробороса (с целью укусить себя за жопу) – эта поддержка старого хлама. В С/C++ ничего не меняют (backward compatibility), чтобы поддержка старого говна оставалась веками. В старом говне ничего не меняют, потому что придётся много переделывать на новый лад. Новшества для сохранения старого дерьма в неизменном, статическом, состоянии. Как и Ваша мантра – «делать всё как встарь на века» – не более чем Плюшкинство.

~~kostyarin_~~ ★★
(06.06.20 23:22:32 MSK)

Ответ на: комментарий от kostyarin_ 06.06.20 23:22:32 MSK

сейчас уже поддержка UTF-8/16/32

Дело не только вкодировке, но и в необходимости поддерживать переводы сообщений и манов на разные языки и связанное с этим разрушение единства терминологии.

torvn77 ★★★★★
(06.06.20 23:32:17 MSK)

Ответ на: комментарий от torvn77 06.06.20 22:34:51 MSK

В то же время если мы говорим в образах, то использование английского языка носителем русского сродни интерпретации байткода вместо прямого двоичного исполнения, со всеми вытекающими, будь то уменьшенная скорость усвоения новой информации, в коде же это порождает порог недопонимания, в виду которого разработчику придётся тратить время чтобы выучить очередное неочевидное сокращение или постоянно перестраиваться с родного языка образов в заморский назывательный

AKonia ★★★
(06.06.20 23:45:06 MSK)

Ссылка

Ответ на: комментарий от kostyarin_ 06.06.20 18:33:05 MSK

Сравнение pid'ов быстрее. Это даже лучше, но решение не универсальное (pid может быть неизвестен).

Закомментировал ветку if (memchr(src, 0x9B, len)) в escape.c, перекомпилировал procps-ng:

$ ./configure --prefix=/home/user/temp/procps-ng; make; make install

И всё получилось:

$ ps axww | grep nano
 5980 pts/6    T      0:00 nano -w ?ето
 6105 pts/6    S+     0:00 grep --colour=auto nano
cd /home/user/temp/procps-ng/bin
$ ./ps axww | grep nano
 5980 pts/6    T      0:00 nano -w Лето
 6116 pts/6    S+     0:00 grep --colour=auto nano

Спасибо!

novus ★★
(07.06.20 01:11:44 MSK) автор топика

Ссылка

Ответ на: комментарий от torvn77 06.06.20 23:32:17 MSK

Дело не только вкодировке, но и в необходимости поддерживать переводы сообщений и манов на разные языки и связанное с этим разрушение единства терминологии.

Ага, русские имена файлов разрушают терминологию. Поверил.
Маны никто не читает. Они составлены бездарно в большинстве случаев. Ими пользуются только по тому, что читать больше нечего в принципе.
Как образуются термины и как они используются? Давайте лоропеду доверим решать.
«Когда разделителем дробной части выступает запятая у меня замыкает мозг» – из той же оперы.
И т.д. и т.п.

~~kostyarin_~~ ★★
(07.06.20 07:46:39 MSK)

Ссылка

Ответ на: комментарий от anonymous 06.06.20 22:45:37 MSK

Сам не могёшь, чтоле? %/

Не знаю. Не интересовался проблемой. Просто, если заводят иссуе в упстреаме и указывают на проблемное место кода, то обычно предлагают патч для решения.

anonymous
(07.06.20 07:49:42 MSK)