LINUX.ORG.RU

История изменений

Исправление LightDiver, (текущая версия) :

Так в китайском морфемы вообще по 3-4 байта. Тут еще структура языка влияет. Я не к тому, что кириллица хуже - это вообще для меня побочно стало неприятным сюрпризом, а к тому, что иероглифы это не плохо. Есть свои преимущества в них.

Что интересно, в китайском еще и самые короткие в среднем предложения. Китайский самый компактный выходит, как внешне, так и байтово. Английский на втором месте чуууть чуть отставая от китайского. Русский сильно больше. Очень сильно. В среднем 30-60 байт китайский, 40-60 - английскйи, а русский 140-200.

Я как раз сейчас работаю плотно с кодировкой кириллицы в очень стесненных условиях и это ппц. Проще тупо кодировать ее в латиницу и работать с этим. Причем, лучше всего не транслитерация, а кодирование в «иероглифы». Это получается в несколько раз компактнее, а работа быстрее.

ns_chat_log_line_q_p = {
	["лог_чат"] = {
		"  %  b 15 1I 1Z 2M 2l 34 3b 4F 4| 5- 5r 6M 6j 7H 7_ 83 8< 8T 8g 9A 9P 9z A* B9 BO Bg C8 C@ CZ Cn DF Db Dw EI Er FB FK F_ F] G) Gi #3 #k $H $v %H (0 (> (^ *I *j +A +M +y -/ -v /D /a /} ;R ;u <( <U <l =D >N @N @o H4 H) H` H[ II

Исправление LightDiver, :

Так в китайском морфемы вообще по 3-4 байта. Тут еще структура языка влияет. Я не к тому, что кириллица хуже - это вообще для меня побочно стало неприятным сюрпризом, а к тому, что иероглифы это не плохо. Есть свои преимущества в них.

Что интересно, в китайском еще и самые короткие в среднем предложения. Китайский самый компактный выходит, как внешне, так и байтово. Английский на втором месте чуууть чуть отставая от китайского. Русский сильно больше. Очень сильно. В среднем 30-60 байт китайский, 40-60 - английскйи, а русский 140-200.

Я как раз сейчас работаю плотно с кодировкой кириллицы в очень стесненных условиях и это ппц. Проще тупо кодировать ее в латиницу и работать с этим. Причем, лучше всего не транслитерация, а кодирование в «иероглифы». Это получается в несколько раз компактнее, а работа быстрее.

Исправление LightDiver, :

Так в китайском морфемы вообще по 3-4 байта. Тут еще структура языка влияет. Я не к тому, что кириллица хуже - это вообще для меня побочно стало неприятным сюрпризом, а к тому, что иероглифы это не плохо. Есть свои преимущества в них.

Что интересно, в китайском еще и самые короткие в среднем предложения. Китайский самый компактный выходит, как внешне, так и байтово. Английский на втором месте чуууть чуть отставая от китайского. Русский сильно больше. Очень сильно. В среднем 30-60 байт китайский, 40-60 - английскйи, а русский 140-200.

Я как раз сейчас работаю плотно с кодировкой кириллицы в очень стесненных условиях и это ппц. Проще тупо кодировать ее в латиницу и работать с этим.

Исходная версия LightDiver, :

Так в китайском морфемы вообще по 3-4 байта. Тут еще структура языка влияет. Я не к тому, что кириллица хуже - это вообще для меня побочно стало неприятным сюрпризом, а к тому, что иероглифы это не плохо. Есть свои преимущества в них.