LINUX.ORG.RU

В X11 кодировкой по умолчанию для России становится UTF8

 , , ,


0

0

Три часа назад, не без помощи со стороны svu, Daniel Stone внёс в код libX11 важное изменение, лог которого звучит следующим образом: "так как никто не пользуется кодировкой 8859-5, то кодировкой по умолчанию для России будет UTF-8".

Не прошло и 20 лет...

>>> Подробности

Re: В X11 кодировкой по умолчанию для России становится UTF8

>Да вроде бы маководы жаловались на свой родный терминал.

кто-то тут говорил выше что коммерческое == качественное? ;)

как речь о проблеммах то сразу всплывают микрософтоиды и маковводы

xargs ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>почему большая часть рунета в кодировке 1251, а не в utf16?
Привычка, старый windows, другое? Или уже количество сайтов в win-1251 кодировке в рунете решает что используется внутри Windows? Интересная логика.

Deleted ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>Привычка, старый windows, другое?

что значит старый виндовс? win3.1? win98? win2000? winXP?

огласите весь список пжалста, а то на как рекламные агитки кричать так у них де юникод со времен NT4, а как на вопрос "почему 1251" так у них еще "старый виндовс"

виста тоже старый виндовс?

xargs ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

> "и только M$ шагает невногу"

См. википедию.

> какая из немертвых ОС (кроме биллиных поделок) сейчас не поддерживает utf-8 локали?

symbian? palmos? os400?

> если бы изначально стояло "но не наоборот" никаких бы utf8 великов не изобретал бы никто.

Это неважно. Важно то, что "наоборот" никто никогда не обещал. Его нет и не будет.

> то есть и новые и старые данные

Новые проги работают с новыми и старыми данными. Старые проги (8-битные) работают со старыми данными. Старые проги (перл) не обязаны работать с новыми данными без изменений в коде.

svu ★★★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>Или уже количество сайтов в win-1251 кодировке в рунете решает что используется внутри Windows? Интересная логика.

наиболее логично предположение, что та кодировка в которой создается большинство документов в данной операционной системе и является основной для этой ОС. основная часть рунета в 1251

точка

xargs ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>symbian? palmos? os400?

я просил немертвых

>См. википедию.

и что ты там написал? типа если ты тут сгородил чушь это одно, а если ты ее в википедии повторил то внушительнее выглядеть стало?

>Старые проги (перл) не обязаны работать с новыми данными без изменений в коде.

perl 5.8.8 старая прога или новая?

xargs ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

Старый windows это ME и ниже. ещё вопросы? Вы по существу, пожалуйста.

> так у них де юникод со времен NT4
И много пользователей пользовалось NT4, не имея возможности, скажем, игрушки запускать?

>виста тоже старый виндовс?
т.е. весь рунет сформировался сразу после выхода висты? Вот ведь неожиданность то. Виста появилась совсем недавно и есть далеко не у всех. Как её наличие или отсутствие влияет на использование win-1251 большинством в рунете? + кстати, приведите статистику что ли, что за такие серъёзные организации, которых так много?

Deleted ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>основная часть рунета в 1251

мало того, я думаю в рунете КРАЙНЕ СЛОЖНО БУДЕТ НАЙТИ сайт в UTF16: родная якобы кодировка Win. Что в Win в ее РОДНОЙ кодировке сложно документы создавать?

расскажите еще что-то смешное

про юникод в венде уже посмеялись

xargs ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

> наиболее логично предположение, что та кодировка в которой создается большинство документов в данной операционной системе и является основной для этой ОС.

Как связана опция формата по умолчанию в редакторе с внутренним устройством OS? Вы телепат или в MS работаете?

Deleted ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>Старый windows это ME и ниже. ещё вопросы? Вы по существу, пожалуйста.

8-9 лет все только на привычке стало быть держится?

ежики плачут и колются но не хотят применять РОДНУЮ кодировку M$Win?

xargs ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

господа! я поражен. я поражен до глубины души. такое количество нелепостей и ни на чем не основанных мифов в одном треде — это нечто. да был бы это сколько-нибудь сложный вопрос, но ведь нет. все что надо о юникоде и его кодировках знать, описывается всего на нескольких страницах википедии (правда желательно читать английский вариант — он почему-то понятнее). и неспособность или нежелание прочитать наконец эти сведения, не может свидетельствовать ни о чем кроме пристрастия к воинствующему ламерству.

@svu: еще раз выражаю свой респект.

dmiceman ★★★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

Курение тоже сколько лет держится. А вобщем-то тоже привычка. И? Ёжики вообще любят кактусы, что тут сделать?

Ещё к примеру, скажем, народ.ру требует win-1251. Это тоже объясняется устройством OS? Яндекс уже Windows разрабатывает?

Deleted ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>все что надо о юникоде и его кодировках знать, описывается всего на нескольких страницах

мы здесь не о юникоде спорим, а о рекламных штампах вбитых в бедные головы потребителей гхм продукции M$

>википедии

ты тоже считаешь что если ты повторишь сказанную чушь на википедии то она станет весомее?

xargs ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

помогите, пожалуйста, со следующим (постил ранее в форум, никто не ответил)

smb-2-smb Есть 2 сервера, один RH 7.2 с самбой 2.* на koi8-r, второй - win2000. Виндовые клиенты подключают расшаренные диски с обоих серверов без проблем, в том числе с русскими названиями файлов.

Линуксовые клиенты, на АСП 11 (утф8), лайв-сиди убунты также без проблем монтируют указанные общие каталоги. Причем для АСП использовал след команду: mount -t smbfs //.win.. /mnt/w2k -o codepage=866,iocharset=utf8 mount -t smbfs //.lin.. /mnt/lin -o codepage=866,iocharset=utf8

,когда были старые системы, на кои8, то соответственно изменял на кои8, все было замечательно

Установил Федору 7 (8-ка то же самое) в качестве клиента на одну из машин. Монтирую те же каталоги с теми же опциями, только используя -t ciffs. Виндовый ресурс монтируется без крякозябр с русскими именами файлов, а линуксовый - нет.

Пробовал и без монтирования, например в КДЕ smb://lin/share, та же петрушка, хотя в свойсвах конка указана кодировка 866 для самба ресурсов. Та же операция с виндовыми ресурсами дает положительный результат.

Где искать ошибку? Помогите, пожалуйста.

anonymous ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

> разработчики яндекса сидят на виндавсе, вот и все
Citation needed. + вы таки не ответили на вопрос:

"Как связана опция формата по умолчанию в редакторе с внутренним устройством OS? Вы телепат или в MS работаете?"

Deleted ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>unsigned char *p;

понял, я совсем не на то, что нужно обратил внимание

>{p--; while (*p&192==128) p--;}

А если этот символ |вдруг| окажется 11111111b? Не всё так просто ;)

frame ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

> Как связана опция формата по умолчанию в редакторе с внутренним устройством OS?

да уж, в венде тот еще зоопарк кодировок. Ослик по дефолту смотрит на cp1251, smbfs на cp866, а notepad на utf-16... Ну не шизофрения, а?

anonymous ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>мало того, я думаю в рунете КРАЙНЕ СЛОЖНО БУДЕТ НАЙТИ сайт в UTF16: родная якобы кодировка Win. Что в Win в ее РОДНОЙ кодировке сложно документы создавать?

Что значит "родная"? Та, в которую идет трансляция параметров для *W функций и их названий - UCS-2 (в т.ч. при вызове *A функций). При чем тут вообще какие-то документы? Линукс utf8 использует только в коде vt, остальное - ansi. Прекращай нести пургу.

frame ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>"Как связана опция формата по умолчанию в редакторе

в ОДНОМ редакторе - никак

а в большинстве она стоит в соответствии с системной кодировкой

xargs ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

to xargs

Все проще, на сколько я помню, по RFC в HTTP используется ASCII совместимая (или по крайне мере проще реализуется), то есть UTF16 не проходит, а cp1251 проходит. Так же как и UTF8, что сейчас в мире чаще всего и используется для web-a.

A UTF16 остается внутренней кодировкой, как wchar_t (32bits) в POSIX.

Все крики про не постоянную длину UTF8 чушь, это транспортная кодировка, преобразуемая во внутреннюю (wchar_t). А вот с UTF16 засада - это тоже кодировка с не постоянной длиной, НО программеры об этом НЕ знают :D.

Так что глюки растут и ширятся. ;)))))))))))))

fi ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>Что значит "родная"?

это и пытаюсь выяснить у кричащих о том что у венды давно уже юникод "родной"

если он родной то почему документы в 1251, сеть в 866 итп итд?

xargs ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>если он родной то почему документы в 1251, сеть в 866 итп итд?

Я так понимаю, что речь шла о внутренней кодировке WinAPI.

KRoN73 ★★★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>Все проще, на сколько я помню, по RFC в HTTP используется ASCII совместимая

только для заголовков

контент пакуется во всякие base64 итп и идет хоть бинарный хоть ASCII хоть utf32

чтобы http отдавал utf32 достаточно htaccess прописать с нужной кодировкой и но проблем

другой вопрос что файлы в венде нечем создавать в utf16/32 потому что нет в венде средств для этого, кроме рекламных плакатов

xargs ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>А если этот символ |вдруг| окажется 11111111b? Не всё так просто ;)

В UTF-8, ЕМНИП, нет байта 0xFF. Вообще нет.

Символ же 0xFF кодируется как 0xC3 0xBF

KRoN73 ★★★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>Я так понимаю, что речь шла о внутренней кодировке WinAPI.

WinAPI их ведь зоопарк каждая новая версия венды - новый WinAPI api16, api32, api64 вот новый появился

ты какой имеешь ввиду?

если расшарить файлы в сеть с висты, то на клиенте все равно придется прописывать cp866 чтобы русские имена правильно показывались

да и не видно массового создания сайтов в юникодных кодировках от пользователей висты-64

xargs ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>ты какой имеешь ввиду?

Win32, начиная с WinNT. *W функции, если не ошибаюсь.

>если расшарить файлы в сеть с висты, то на клиенте все равно придется прописывать cp866 чтобы русские имена правильно показывались

Это проблема не WinAPI, а уровня протоколов. У меня, вон, Linux на UTF-8, а Samba всё равно в cp866 только работает.

>да и не видно массового создания сайтов в юникодных кодировках от пользователей висты-64

Опять же, Linux на работе в UTF-8, а сайт делается в KOI8-R. И юникодность Linux тут не при чём.

KRoN73 ★★★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>это и пытаюсь выяснить у кричащих о том что у венды давно уже юникод "родной"

Под юникодом всегда имелась ввиду возможность отображать текст (или получать о нем информацию) системными GDI-функциями из UNICODE-TrueType шрифтов

>если он родной то почему документы в 1251, сеть в 866 итп итд?

к вышескзанному мной это совершенно ортогонально

frame ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>а в большинстве она стоит в соответствии с системной кодировкой
4.2. к этому никто не обязывает. на вторую часть вопроса вы так и не ответили - т.е. если вы оперируете подобными сведениями, то они у вас должны откуда-то быть. откуда же?

Deleted ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>В UTF-8, ЕМНИП, нет байта 0xFF. Вообще нет.

Это совсем не означает, что он не может встретиться, т.е. помимо всего прочего нужна ещё проверка на соответсвие rfc3629, т.е. дополнительный код, так что не все так просто, в сравнении =)

frame ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>Это совсем не означает, что он не может встретиться

В UTF-8 - не может. В бинарных данных - да. Но какое отношение бинарные данные имеют к UTF-8? :)

KRoN73 ★★★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>В UTF-8 - не может. В бинарных данных - да.

Не "не может", а "не должен", т.е. мы или явно подразумеваем, что весь текст у нас в utf8 и он корректен, или везде делаем проверки

>Но какое отношение бинарные данные имеют к UTF-8? :)

Никакого. Просто подразумевая корректность, вы исходите от обратного =) А я же указываю на различия в работе между utf8 и однобайтовыми кодировками

frame ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

> и второй вопрос: почему нигде кроме биллиных [недо]поделок эти сигнатуры не применяются?

libiconv ещё как использует!

yyk ★★★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

> да это не смешно, когда такое количество народу как заведенные повторяют рекламную чушь от билли что якобы юникод давно и внутри венды :-\

А мусье не различает хранение и обработку информации?

На счёт "нескольких функций в винде" - вот это смешно, ибо большинство системных функций со строковыми данными есть в двух "ипостасях" - текущей локали и уникодные.

yyk ★★★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>Никакого. Просто подразумевая корректность, вы исходите от обратного

Или у нас UTF-8 и тогда такой метод подсчёта символов будет работать, или у нас мусор, и тогда о каком числе символов вообще может идти речь? :)

KRoN73 ★★★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>ибо большинство системных функций со строковыми данными есть в двух "ипостасях" - текущей локали и уникодные.

и поэтому уникодные никто (почти) не пользует?

может проблема таки в самих функциях?

xargs ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>Людям свойственно делать самые глупые ошибки в самых неожиданных местах ;)

Людям - да. Но я сомневаюсь, что кто-то будет набивать UTF-8 текст в HEX-редакторе в двоичном виде :)

KRoN73 ★★★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

> я просил немертвых

Симбиан мертв??? ОС400 мертва??

> и что ты там написал?

Я в википедию не пишу. Если она не авторитет - погуглите еще. То, что внутри винды утф16 - это никак не изменит.

> perl 5.8.8 старая прога или новая?

Если не умеет работать с корректными файлами в утф8 - "старая" (относительно поддержики утф8)

svu ★★★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

>и поэтому уникодные никто (почти) не пользует?

Дает знать твоя плохая осведомленность: ansi-функции в winnt это по сути заглушки к юникодным wide-функциям - при их вызовах происходит трансляция в юникод, поэтому в nt-системах рекомендуют пользоваться wide-функциями, а ansi оставлены для совместимости со старыми приложениями

frame ★★★ ()

Re: В X11 кодировкой по умолчанию для России становится UTF8

> А утф8 выбран потому, что он позволяет использовать существующие ascii файлы. Корректный ascii файл --> корректный utf8 файл.

Тем самым полностью потеряли возможность автоматического (на этапе компиляции) аудита программ на юникодные проблемы. Корректная работа с utf-8 --> корректная работа с ascii, но не наоборот.

Хотя согласен, что переход на utf-32 потребовал бы отказ от половины стандартной библиотеки C, даже от такой стандартной функции как printf(). Но зато бы все переписали и провели хотя бы минимальный аудит.

AEP ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.