История изменений
Исправление LightDiver, (текущая версия) :
Так в китайском морфемы вообще по 3-4 байта. Тут еще структура языка влияет. Я не к тому, что кириллица хуже - это вообще для меня побочно стало неприятным сюрпризом, а к тому, что иероглифы это не плохо. Есть свои преимущества в них.
Что интересно, в китайском еще и самые короткие в среднем предложения. Китайский самый компактный выходит, как внешне, так и байтово. Английский на втором месте чуууть чуть отставая от китайского. Русский сильно больше. Очень сильно. В среднем 30-60 байт китайский, 40-60 - английскйи, а русский 140-200.
Я как раз сейчас работаю плотно с кодировкой кириллицы в очень стесненных условиях и это ппц. Проще тупо кодировать ее в латиницу и работать с этим. Причем, лучше всего не транслитерация, а кодирование в «иероглифы». Это получается в несколько раз компактнее, а работа быстрее.
ns_chat_log_line_q_p = {
["лог_чат"] = {
" % b 15 1I 1Z 2M 2l 34 3b 4F 4| 5- 5r 6M 6j 7H 7_ 83 8< 8T 8g 9A 9P 9z A* B9 BO Bg C8 C@ CZ Cn DF Db Dw EI Er FB FK F_ F] G) Gi #3 #k $H $v %H (0 (> (^ *I *j +A +M +y -/ -v /D /a /} ;R ;u <( <U <l =D >N @N @o H4 H) H` H[ II
Исправление LightDiver, :
Так в китайском морфемы вообще по 3-4 байта. Тут еще структура языка влияет. Я не к тому, что кириллица хуже - это вообще для меня побочно стало неприятным сюрпризом, а к тому, что иероглифы это не плохо. Есть свои преимущества в них.
Что интересно, в китайском еще и самые короткие в среднем предложения. Китайский самый компактный выходит, как внешне, так и байтово. Английский на втором месте чуууть чуть отставая от китайского. Русский сильно больше. Очень сильно. В среднем 30-60 байт китайский, 40-60 - английскйи, а русский 140-200.
Я как раз сейчас работаю плотно с кодировкой кириллицы в очень стесненных условиях и это ппц. Проще тупо кодировать ее в латиницу и работать с этим. Причем, лучше всего не транслитерация, а кодирование в «иероглифы». Это получается в несколько раз компактнее, а работа быстрее.
Исправление LightDiver, :
Так в китайском морфемы вообще по 3-4 байта. Тут еще структура языка влияет. Я не к тому, что кириллица хуже - это вообще для меня побочно стало неприятным сюрпризом, а к тому, что иероглифы это не плохо. Есть свои преимущества в них.
Что интересно, в китайском еще и самые короткие в среднем предложения. Китайский самый компактный выходит, как внешне, так и байтово. Английский на втором месте чуууть чуть отставая от китайского. Русский сильно больше. Очень сильно. В среднем 30-60 байт китайский, 40-60 - английскйи, а русский 140-200.
Я как раз сейчас работаю плотно с кодировкой кириллицы в очень стесненных условиях и это ппц. Проще тупо кодировать ее в латиницу и работать с этим.
Исходная версия LightDiver, :
Так в китайском морфемы вообще по 3-4 байта. Тут еще структура языка влияет. Я не к тому, что кириллица хуже - это вообще для меня побочно стало неприятным сюрпризом, а к тому, что иероглифы это не плохо. Есть свои преимущества в них.