История изменений

Исправление saahriktu, 08.09.17 10:54 (текущая версия) :

Нет, просто удобно. Юзать можно и UTF-8. Но, зачем, если однобайтные кодировки удобнее? При локали UTF-8 без костылей даже сложно совместить шестнадцатеричное и текстовое представления чтобы удобнее ориентироваться в двоичных данных:

> hexdump -C /dev/urandom | head -n 20
00000000  57 e9 01 f7 d3 8c e3 8e  ef d3 32 fa 51 29 1f 68  |WИ.Вс▄Ц▌Ос2ЗQ).h|
00000010  7d 23 fa 17 62 09 18 92  e0 0f d2 60 cd 69 5c aa  |}#З.b..▓Ю.р`мi\╙|
00000020  f1 64 ce 4b 97 e5 53 3e  7e c5 d0 5e 1d fe 69 74  |ЯdнK≈ЕS>~еп^.Чit|
00000030  78 8f f8 00 45 b0 70 7c  70 9f 50 03 e1 c9 13 ad  |x▐Ь.E╟p|p÷P.Аи.╜|
00000040  7d fa d7 c1 c3 61 8e 7e  d5 56 12 50 4c f4 f5 67  |}Звацa▌~уV.PLТУg|
00000050  24 a9 af de 06 67 81 98  57 1d f6 99 a9 9e b0 d3  |$╘╞ч.g│≤W.Ж≥╘·╟с|
00000060  b6 81 03 0f da 34 60 84  e4 25 51 10 ce 78 e8 cd  |╤│..з4`└Д%Q.нxХм|
00000070  3f b5 a4 76 60 46 a7 c9  01 0d e4 d3 39 5a a6 5e  |?╣╓v`F╖и..Дс9Z╕^|
00000080  53 25 f2 58 00 d3 68 22  3e a5 d5 6a 21 eb 6b 2b  |S%РX.сh">╔уj!Кk+|
00000090  82 64 41 15 b7 a9 58 9f  84 92 99 72 ca c4 c1 33  |┌dA.╥╘X÷└▓≥rйда3|
000000a0  21 63 db 4e 81 38 65 f1  9c da 2c 0d 2a 0a f2 a3  |!cшN│8eЯ°з,.*.Рё|
000000b0  99 78 5d 4d 99 10 58 21  b4 b8 11 ee ec 3e d7 84  |≥x]M≥.X!╢╦.НЛ>в└|
000000c0  6a 16 a0 30 a1 a2 cc fe  74 eb 7e 9a 49 f3 ac 43  |j.═0║╒лЧtК~ IС╛C|
000000d0  05 fb e9 79 6c 29 d5 87  d3 36 97 ed 30 39 8d d0  |.ШИyl)у┤с6≈М09█п|
000000e0  3b 83 8d 8e 4f fc 4a 01  e1 6d 53 57 a2 68 ff 9e  |;┐█▌OЭJ.АmSW╒hЪ·|
000000f0  24 95 53 56 25 9e 85 97  ca 64 af c6 e8 5b db 5f  |$∙SV%·┘≈йd╞фХ[ш_|
00000100  50 8c 09 f5 e6 9f 33 23  a5 83 6d d4 bf ec 2f e5  |P▄.УФ÷3#╔┐mт©Л/Е|
00000110  b2 e3 f9 7e 69 f5 27 eb  13 26 d3 0d 85 24 be b3  |╡ЦЫ~iУ'К.&с.┘$╬Ё|
00000120  d6 3b 8d 4c c7 c9 d7 15  2a 27 a6 60 73 15 ec 7e  |ж;█Lгив.*'╕`s.Л~|
00000130  bd fc 4f 7f c6 22 db 54  74 d6 4c c9 f5 83 5d 5b  |╫ЭO.ф"шTtжLиУ┐][|

В общем, удобно когда 0x80-0xFF - конкретные символы, а не начало последовательности байт.

Исходная версия saahriktu, 08.09.17 10:53:

Нет, просто удобно. Юзать можно и UTF-8. Но, зачем, если однобайтные кодировки удобнее? При локали UTF-8 без костылей даже сложно совместить шестнадцатеричное и текстовое представления чтобы удобнее ориетироваться в двоичных данных:

> hexdump -C /dev/urandom | head -n 20
00000000  57 e9 01 f7 d3 8c e3 8e  ef d3 32 fa 51 29 1f 68  |WИ.Вс▄Ц▌Ос2ЗQ).h|
00000010  7d 23 fa 17 62 09 18 92  e0 0f d2 60 cd 69 5c aa  |}#З.b..▓Ю.р`мi\╙|
00000020  f1 64 ce 4b 97 e5 53 3e  7e c5 d0 5e 1d fe 69 74  |ЯdнK≈ЕS>~еп^.Чit|
00000030  78 8f f8 00 45 b0 70 7c  70 9f 50 03 e1 c9 13 ad  |x▐Ь.E╟p|p÷P.Аи.╜|
00000040  7d fa d7 c1 c3 61 8e 7e  d5 56 12 50 4c f4 f5 67  |}Звацa▌~уV.PLТУg|
00000050  24 a9 af de 06 67 81 98  57 1d f6 99 a9 9e b0 d3  |$╘╞ч.g│≤W.Ж≥╘·╟с|
00000060  b6 81 03 0f da 34 60 84  e4 25 51 10 ce 78 e8 cd  |╤│..з4`└Д%Q.нxХм|
00000070  3f b5 a4 76 60 46 a7 c9  01 0d e4 d3 39 5a a6 5e  |?╣╓v`F╖и..Дс9Z╕^|
00000080  53 25 f2 58 00 d3 68 22  3e a5 d5 6a 21 eb 6b 2b  |S%РX.сh">╔уj!Кk+|
00000090  82 64 41 15 b7 a9 58 9f  84 92 99 72 ca c4 c1 33  |┌dA.╥╘X÷└▓≥rйда3|
000000a0  21 63 db 4e 81 38 65 f1  9c da 2c 0d 2a 0a f2 a3  |!cшN│8eЯ°з,.*.Рё|
000000b0  99 78 5d 4d 99 10 58 21  b4 b8 11 ee ec 3e d7 84  |≥x]M≥.X!╢╦.НЛ>в└|
000000c0  6a 16 a0 30 a1 a2 cc fe  74 eb 7e 9a 49 f3 ac 43  |j.═0║╒лЧtК~ IС╛C|
000000d0  05 fb e9 79 6c 29 d5 87  d3 36 97 ed 30 39 8d d0  |.ШИyl)у┤с6≈М09█п|
000000e0  3b 83 8d 8e 4f fc 4a 01  e1 6d 53 57 a2 68 ff 9e  |;┐█▌OЭJ.АmSW╒hЪ·|
000000f0  24 95 53 56 25 9e 85 97  ca 64 af c6 e8 5b db 5f  |$∙SV%·┘≈йd╞фХ[ш_|
00000100  50 8c 09 f5 e6 9f 33 23  a5 83 6d d4 bf ec 2f e5  |P▄.УФ÷3#╔┐mт©Л/Е|
00000110  b2 e3 f9 7e 69 f5 27 eb  13 26 d3 0d 85 24 be b3  |╡ЦЫ~iУ'К.&с.┘$╬Ё|
00000120  d6 3b 8d 4c c7 c9 d7 15  2a 27 a6 60 73 15 ec 7e  |ж;█Lгив.*'╕`s.Л~|
00000130  bd fc 4f 7f c6 22 db 54  74 d6 4c c9 f5 83 5d 5b  |╫ЭO.ф"шTtжLиУ┐][|

В общем, удобно когда 0x80-0xFF - конкретные символы, а не начало последовательности байт.