LINUX.ORG.RU

Ответ на: комментарий от PolarFox

было бы логичнее как мне кажется поставить по алфавиту, но наверняка есть причина по которой она стоит там где она стоит. и я хочу ее знать

iwsyhgia
() автор топика
Ответ на: комментарий от iwsyhgia

Есть другие языки кроме русского, также использующие кириллицу. В них может быть другой порядок букв, отсутствовать буквы которые есть в русском, присутствовать буквы, которых нет в русском. Так что алфавитный порядок для всех языков сразу не сделаешь.

И наверняка в стандарте есть рекомендация, по которой модифицированные варианты букв идут после основных.

PolarFox ★★★★★
()

Товарищ, буква «ё» не только в Unicode отдельно

cp1251 и ibm866 этим тоже балуются:

echo -n абвгдеёжзийклмно | iconv -t cp1251 | dd conv=swab,notrunc 2>/dev/null | hexdump

0000000 e0e1 e2e3 e4e5 b8e6 e7e8 e9ea ebec edee
0000010


echo -n абвгдеёжзийклмно | iconv -t ibm866 | dd conv=swab,notrunc 2>/dev/null | hexdump

0000000 a0a1 a2a3 a4a5 f1a6 a7a8 a9aa abac adae
0000010


Изначально из‑за того, что буква «ё» наиболее редко используемая, а остальные буквы вписывались ровно в 2⁵ байт. Имхо конечно, но ящитаю наиболее логично.

Northsoft ★★
()

результат работы комитета.

qulinxao ★★☆
()

Более того, она может быть представлена не одним символом, а парой (compound): е и пара точек сверху.

bormant ★★★★★
()
Ответ на: комментарий от alegz
echo -n абвгдеёжзийклмно | od -t x1 -An
 c1 c2 d7 c7 c4 c5 a3 d6 da c9 ca cb cc cd ce cf
Eddy_Em ☆☆☆☆☆
()

Ну может хотя-бы потому что алфавит то не русский, а славянский. И скорее всего все буквы которые не находятся одновременно в большинстве алфавитов будут вынесены под конец.

abs ★★★
()
Ответ на: комментарий от Eddy_Em

ЊЋЌЍЎЏАБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдежзийклмнопрстуфхцчшщъыьэюяѐёђѓєѕіїјљ

Как видим в начало вынесены странные буквы, и в конец тоже самое. ЊЋЌЍЎЏ + ѐёђѓєѕії

abs ★★★
()
Ответ на: комментарий от Eddy_Em

а славянский

Черт, ошибочка, хотел сказать кириллица.

abs ★★★
()
Ответ на: комментарий от abs

странные буквы

Ничуть не странные! Скажем, Џ — абхазская "пц", а еще некоторые буквы используются в болгарском, беларусском и прочих языках (т.к. есть у них звуки, которые требуют почему-то отдельных буковок). Вот, та же Ў — это беларусская "в", но мягкая.

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от abs

Какие же они "редкие"? Это только с нашей колокольни так кажется. А по процентажу славян русские — ничуть не большинство! Сколько русских на Шарике? Миллионов 30?

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Eddy_Em

Какие же они «редкие»?

Ну мне кажется создатели юникода судили не по количеству людей, а по количеству вхождения в разные языки. Вот буква А наверное входит во все языки, а буква ё, или там Џ только в один. Более того, как по алфавиту расставить ё и Џ, какая из них должна быть раньше? Не ясно, вот из-за этого их наверное и кинули в край.

abs ★★★
()
Ответ на: комментарий от abs

В хрюникоде столько позиций, что можно все кириллические алфавиты было бы туда засунуть целиком! Пусть даже буква "а" встречалась бы там 1000 раз!

Eddy_Em ☆☆☆☆☆
()

Расположение букв в Юникоде скопировали с виндовой кодировки 1251. А в ней поставили заглавные и строчные так, чтобы менять регистр сменой одного бита и выровняли на кратные 16 блоки.

Кроме того, у людей, которых Майкросфт привлекал для консультаций при создании новй кодировки, не было единого мнения нужны ли буквы сверх 32. Сторонние советники так и не смогли договориться между собой, поэтому Майкрософт сделал всё сам, но с учётом их пожеланий и с оглядкой на имевшиеся в СССР кодировки. В которых ё тоже вынесена из основного блока.

question4 ★★★★★
()
Ответ на: комментарий от Eddy_Em

В моей любимой КОИ8 вообще ад!

Там предельно просто. Русские буквы в алфавитном порядке английского алфавита. При сбросе старшего бита получается транслит. Идеальная кодировка для не осиливших перешить ПЗУ импортных 7-битных машин.

question4 ★★★★★
()

догадка: она идёт не по кириллическому порядку, а по греческому..

anonymous
()
Ответ на: комментарий от question4

с оглядкой на имевшиеся в СССР кодировки. В которых ё тоже вынесена из основного блока.

Ага:

 32 -  	 64 - @	 96 - `	128 - ─	160 - ═	192 - ю	224 - Ю	
 33 - !	 65 - A	 97 - a	129 - │	161 - ║	193 - а	225 - А	
 34 - "	 66 - B	 98 - b	130 - ┌	162 - ╒	194 - б	226 - Б	
 35 - #	 67 - C	 99 - c	131 - ┐	163 - ё	195 - ц	227 - Ц	
 36 - $	 68 - D	100 - d	132 - └	164 - ╓	196 - д	228 - Д	
 37 - %	 69 - E	101 - e	133 - ┘	165 - ╔	197 - е	229 - Е	
 38 - &	 70 - F	102 - f	134 - ├	166 - ╕	198 - ф	230 - Ф	
 39 - '	 71 - G	103 - g	135 - ┤	167 - ╖	199 - г	231 - Г	
 40 - (	 72 - H	104 - h	136 - ┬	168 - ╗	200 - х	232 - Х	
 41 - )	 73 - I	105 - i	137 - ┴	169 - ╘	201 - и	233 - И	
 42 - *	 74 - J	106 - j	138 - ┼	170 - ╙	202 - й	234 - Й	
 43 - +	 75 - K	107 - k	139 - ▀	171 - ╚	203 - к	235 - К	
 44 - ,	 76 - L	108 - l	140 - ▄	172 - ╛	204 - л	236 - Л	
 45 - -	 77 - M	109 - m	141 - █	173 - ╜	205 - м	237 - М	
 46 - .	 78 - N	110 - n	142 - ▌	174 - ╝	206 - н	238 - Н	
 47 - /	 79 - O	111 - o	143 - ▐	175 - ╞	207 - о	239 - О	
 48 - 0	 80 - P	112 - p	144 - ░	176 - ╟	208 - п	240 - П	
 49 - 1	 81 - Q	113 - q	145 - ▒	177 - ╠	209 - я	241 - Я	
 50 - 2	 82 - R	114 - r	146 - ▓	178 - ╡	210 - р	242 - Р	
 51 - 3	 83 - S	115 - s	147 - ⌠	179 - Ё	211 - с	243 - С	
 52 - 4	 84 - T	116 - t	148 - ■	180 - ╢	212 - т	244 - Т	
 53 - 5	 85 - U	117 - u	149 - ∙	181 - ╣	213 - у	245 - У	
 54 - 6	 86 - V	118 - v	150 - √	182 - ╤	214 - ж	246 - Ж	
 55 - 7	 87 - W	119 - w	151 - ≈	183 - ╥	215 - в	247 - В	
 56 - 8	 88 - X	120 - x	152 - ≤	184 - ╦	216 - ь	248 - Ь	
 57 - 9	 89 - Y	121 - y	153 - ≥	185 - ╧	217 - ы	249 - Ы	
 58 - :	 90 - Z	122 - z	154 -  	186 - ╨	218 - з	250 - З	
 59 - ;	 91 - [	123 - {	155 - ⌡	187 - ╩	219 - ш	251 - Ш	
 60 - <	 92 - \	124 - |	156 - °	188 - ╪	220 - э	252 - Э	
 61 - =	 93 - ]	125 - }	157 - ²	189 - ╫	221 - щ	253 - Щ	
 62 - >	 94 - ^	126 - ~	158 - ·	190 - ╬	222 - ч	254 - Ч	
 63 - ?	 95 - _	127 - 	159 - ÷	191 - ©	223 - ъ	255 - Ъ	

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Eddy_Em

А чего ей не работать, если она не кодировкой, а локалью регулируется?

mamboo ★★
()
Ответ на: комментарий от Eddy_Em

"Слава роботам"?

Да. Благодаря им большинству современных людей порядок букв в алфавите никак не критичен, поиск в «бумажных» каталогах сильно устарел, новые словари сорировать просто. К тому, никто более не учит алфавит в виде «За буки веди...». Т.ч. вопрос замены порядка букв в алфавите довольно дёшев.

DonkeyHot ★★★★★
()
Ответ на: "Слава роботам"? от DonkeyHot

поиск в «бумажных» каталогах сильно устарел

Сходи в библиотеку. Посмотрю я, как ты без поиска по бумажному каталогу что-нибудь найдешь...

никто более не учит алфавит

В школе учат. А если кто-то не может свой родной алфавит в прямом порядке оттараторить, тот, похоже, болен...

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Eddy_Em

А если кто-то не может свой родной алфавит в прямом порядке оттараторить, тот, похоже, болен...

Или телефон сенсорный, или это одно и тоже?

Allakka ★★★★
()

Ещё один слоупок

fero ★★★★
()
Ответ на: комментарий от Eddy_Em

Чтобы всё было видно, делают телефоны формата А4.

Allakka ★★★★
()
Ответ на: комментарий от Eddy_Em

Сходи в библиотеку

Не был там лет 20. Неужели до сих пор бумажные индексы?

В школе учат

В виде другой, «бессмысленной» скороговорки. Точно так же (гипотетически) заучивается новая, «совместимая» с кодировкой.

родной алфавит в прямом порядке оттараторить, тот, похоже, болен

Ты же не считаешь, что порядок букв в алфавите ниспослан нам высшими силами, или прошит в генах титульной национальности? То, чем редко пользуются, забывается, а оно сейчас имеет смысл только когда последние батарейки сели.

DonkeyHot ★★★★★
()
Ответ на: комментарий от DonkeyHot

Неужели до сих пор бумажные индексы?

Да. У нас потихоньку электронную БД заполняют, но очень уж медленно.

В виде другой, «бессмысленной» скороговорки

А надо бы по-человечески, чтобы легче запоминалось (аз буки веди глаголъ добро есть...)

Ты же не считаешь, что порядок букв в алфавите ниспослан нам высшими силами

Это устоявшаяся традиция, еще из арамейского письма (алеф, бет, гимель...).

Да и без знания алфавита ты тупо СМСку не набьешь на телефоне ☺! Ну или, скажем, в словаре/энциклопедии как нужную статью отыщешь?

Eddy_Em ☆☆☆☆☆
()
Ответ на: комментарий от Eddy_Em

надо бы по-человечески

Думаю, осмысленную мнемонику под любую последовательнсть букв можно прорифмовать.

без знания алфавита ты тупо СМСку не набьешь на телефоне

Это ещё почему? У меня GKOS с оптимизированной (неалфавитной) «раскладкой».

в словаре/энциклопедии как нужную статью отыщешь

Опять же: 1. в мягком виде мне её роботы найдут. 2. имея исходники и робота переупорядочить статьи проблема сложности «one banana»; 2. большинство печатных справочников уже устарели или поистрепались, всё равно перепечатывать. Т.ч. при желании(*) задача разрешима.

(*) да, я знаю.

DonkeyHot ★★★★★
()
Ответ на: комментарий от Eddy_Em

PS: поиска по бумажному каталогу

Мне тут подумалось, что поиск по бумжному каталогу без знания алфавита не так уж страшен. Поиск в trie с линейным перебором следующей буквы всего лишь в 3 с небольшим раза дольше бисекции.

DonkeyHot ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.