LINUX.ORG.RU

Настройка RedHat 9 на русскую локаль KOI8-R и другое...


0

0

В свое время, после выхода в свет RedHat версии 8.0, мною была написана
статья "Переход с RedHat-7.x на RedHat-8.0", в которой описывалось как
заменить локаль UTF-8 на KOI8-R в связи глючности и проблемности русской
локали UTF-8, с выходом RedHat версии 9 казалось, что эту проблему решили
и русская локаль UTF-8 заработала как надо, правда не везде гладко, но
решаемо. Однако многие пользователи RH9 хотят старую хорошо
отработанную временем локаль KOI8-R, оно и понятно, UTF-8 все еще имеет
проблемы с консольными приложениями, да и с некоторым старым софтом, от
которого не хочется отказываться. Видимо по этой причине меня стали
забрасывать письмами с просьбой рассказать как сделать такой переход, у
меня нашлось немного времени это сделать, поэтому выполняю просьбу тех,
кто меня об этом просил.

P.S. В данной статье рассматривается не только локализация, но и некоторые
наболевшие вопросы по RH9...

>>> Подробности

★★★

Проверено: green

А иврит ?

anonymous
()

:>ограничение в 512 символов не он накладывает...

Ну дак, а куда пойти бедному крестьянину ? Ну не нужны на серверах Х! И чего теперь ?

anonymous
()
Ответ на: комментарий от anonymous

> куда пойти бедному крестьянину ? Ну не нужны на серверах Х! И чего
сразу вспоминается про устаноку Sybase ASE 11.9.2 и oracle v>8.0 с их
"весёлым" требованием Xов. Самое забавное что благодаря этому требованию Sybase я себе 17ку в своё время вытряс: просто показал начальникам страницу из руководства на него из раздела "Устранение неисправностей" (sic!) - "Что делать если у Вас нет 17" монитора?" =D
вопрос: что делать мне, если у нас много больше 10ка писюков вообще без VGA а весь вывод при старте идёт в смеси англ. & русских буковок?
так что utf-8 идёт лесом однозначно как консольный вывод.

mumpster ★★★★★
()

mumpster, извините что слишком кратко объясняю свою позицию по данному вопросу и не совсем точно опровергаю вашу точку зрения.

Итак, мне кажется:

1) поскольку в среде пользователей/разработчиков Линукс (ядра и программ пользователей) нет единого координационного центра, крайне глупо говорить "почему до сих пор не сделали utf-16". Кому вы это говорите? По-моему, поступили проще и правильней -- сделали glibc и iconv, кому надо -- сделают или кросскодировочно, или как попало. Слишком много людей пишут программы коряво независимо от возможностей ОС.

2) Почему вы ратуете за утф-16, а не ucs-4 ? Китай и Японию не уважаете? Узко мыслите, только свои интересы блюдёте, а не общемировые.

3) Про какого Нортона вы говорите -- я понял, не понимаю -- почему при выборе _кодировки_ для ОС Линукс я должен что-то знать про писюки и VGA-адаптеры. Задачи достоверной передачи данных решаются выбором ширины каналов, введением избыточности и прочими дополнительными средствами. Почему бы тогда уж не ввести по два кода на каждый знак цифры, ведь цифра зачастую важнее буквы? (да и букву по контексту можно восстановить, а цифру -- никогда).

Что буква Ё в очередной раз не сделана стандартной, крайне огорчён. Думал, что в уникоде её положение сделали правильным.

chumpa
()
Ответ на: комментарий от chumpa

1) RH очень сильно влияет на то, как дальше идёт развитие Linux. => Выбор RH очень сильно влияет на нас. Лично меня это убедило, что от pure RH надо держаться на расстоянии.

2) потому что utf-16 (конкретно, Basic Multilingual Plane) охватывает свыше 99% частоупотребимых знаков, включая "CJK Unified Ideographs" - если Вы не знаете что это такое - Вам незачем беспокоиться о наших друзьях с Востока. Я, конечно, не знаток китайского, но AFAIK частоупотребмимых базовых иероглифов не более 400 вообще. остальные - либо муть типа нашей яти либо фактически составные. Поэтому выбор M$ вполне разумен - именно ЭТА кодировака обеспечивает РАЗУМНОЕ сочетание интересов большинства и затрат на обеспечение. В реальности, utf-8 для Cyrillic, CJK и т.д. займёт больше места/байт чем utf-16.

найти и проанализировать таблицу BMP оставляю на домашнее задание.;)

3) Гм...ну понятно, матчасть PC Вам незнакома, => какие проблемы могут возникнуть - тоже.
> почему при выборе _кодировки_ для ОС Линукс я должен что-то знать
> про писюки и VGA-адаптерыпотому что:
а) линукс оттуда родом
б) до сих пор основная масса линуксов - на x86/pc
задача достоверной передачи не решается выбором ширины каналов, а русский язык - очень избыточен и даже при потере 50% знаков обеспечивает восстановление исходного текста - в чём ему как раз кои8 и может помочь. Азбуки же с кодированием наиболее часто встречающихся исходных знаков меньшим кол-вом бит широко применяются как в связи так и в других отраслях, например в архиваторах , что наглядно показывает их нужность и применимость. А получилось так, что под ахи-охи о вреде кодировок вместе с водой выплеснули ребёнка. Это же вполне естественно - если в документе используются ТОЛЬКО 100-200 разновидностей знаков (кириллица+латиница, основные китайские тексты, цифры и пунктуация) - использовать только 8 бит. причём для этого достаточно было ввести и стандартизовать понятие "режим кодировки документа". ну нафига амеркисоам это надо -у них так всё тип-топ!;-(
В уникоде положение буквы "Ё" выпадает из стройной сортировки "по коду". BTW, вот вопросик интеерсный - а русские буквы и умляуты или kanji Вы как сортировать меж собой будете?8-)

mumpster ★★★★★
()
Ответ на: комментарий от mumpster

1) В жизни RH влияет на gcc, в основном. К пользователям Debian, Gentoo, Slackware инициативы RH часто настолько перпендикулярны, что и говорить тут нечего. При этом, конечно, красношапочников много (косвенно я один из них -- у меня ALM 2.2). Однако RH ни разу не аналог MS.

2) ну хорошо. Ну теперь я понял, что utf-16 лучше utf-8. Однако вирус "utf-8" уже гуляет в мозгах линуксоидов, и я им доволен. Внедри вирус "utf-16".

3) Аппаратное обеспечение PC мне знакомо. По крайней мере, программы для манипулирования регистрами VGA на ассемблере я писал. Вот только ни разу не хочу принимать особенности аппаратуры одной платформы при принятии долгосрочного и кроссплатформенного решения для кучи людей.

Никто не мешает для транспортных целей ввести аналог кода Шеннона, но "вам надо -- вы и делайте". Мне экономия на голом тексте не нужна. Текстовый http-траффик можно подвергать lzw и иному кодированию достаточно прозрачно (mod_deflate кажется и соотв.стандарт HTTP), почтовый траффик экономить неинтересно, ну а место на диске все тексты занимают и так мало (по сравнению с репозитариями и бинарными файлами). В общем, это недостойная область для оптимизации.

Мой адрес -- kuznecov@blok-caf.ru, думаю здесь уже наш диалог кроме нас мало кому интересен. Пишите, если что.

chumpa
()

Боюсь, что буду слишком многословен, но все же.
Серверов под Linux (в основном Debian - apt-get rulez!) я ставил предостаточно, но их я и не пытался "кириллизовывать", равно как и грузить Xы. А тут задался целью сделать наконец себе Linux-десктоп и понял, что не получается. Перепробовал несколько дистрибутивов, но нигде не получилось получить полнценную кириллицу хотя бы в Xах "из коробки". Всегда что-нибудь, да глючит. То тут вместо русских букв квадратики, то там вместо них западноевропейские символы.
Объясните мне, ламеру, где что почитать на предмет полноценной русификации Xов и приложений под них?

anonymous
()
Ответ на: комментарий от anonymous


"Из коробки" ни один дистрибутив не имеет правильной русификации. И что самое обидное даже русские дистрибутивы этим страдают.

login
()

:>В реальности, utf-8 для Cyrillic, CJK и т.д. займёт больше места/байт чем utf-16....

Очевидно, домашнее задание надо исполнять г. mumзster - так как Cyrillic в utf-8 тоже занимает 2 байта.

anonymous
()

:>В жизни RH влияет на gcc, в основном ...

а также на glibc, kernel - список можно продолжать еще долго ...

это, кстати, не есть хорошо - ну да хоть так...

anonymous
()

> Очевидно, домашнее задание надо исполнять г. mumзster - так как Cyrillic в utf-8 тоже занимает 2 байта.

А CJK скоко байтов заимеет?

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.