LINUX.ORG.RU
 
o1o

Использование Unicode в Linux


0

0

Статья посвящена вопросам связанным с использованием unicode в Linux.

Рассматриваются такие вопросы как:
* установка правильной локали
* преобразование файловых систем (названий файлов)
* преобразование текстовых файлов
* где взять unicode шрифты

В конце статьи даются ссылки на другие полезные ресурсы посвященные вопросам использования unicode

>>> Подробности

# ()
Проверено: ivlad (03.11.2004 13:33:56)

[#] Ответ на: Re: Re: Re: Re: Re: Qecho от amm 04.11.2004 10:31:12  

Re: Re: Re: Re: Re: Re: Qecho

> Зачем в ядре уникод? Где оно, вообще, с текстом работает? ну, засунуть в ядро уникод стоит хотя бы для того чтобы посмотреть что будет твориться на лор :)))

а в придачу еще и xml

anonymous ()
[#] Ответ на: Re: Re: Re: Qecho от anonymous 04.11.2004 8:48:43  

Re: Re: Re: Re: Qecho

>>> Кто нибудь видел utf16 или UCS2 локали?

>> даа. и не только видел. и даже работает. винду поставь.:-)

> А как их в консоли включить?

chcp 10646

anonymous ()
[#] Ответ на: Re: Re: Re: Re: Re: Re: Qecho от anonymous 04.11.2004 12:31:50  

Re: Re: Re: Re: Re: Re: Re: Qecho

> очень просто. в зюмеле хранится юникод. компилятору (или что у вас там -- интерпретатор, groff какой-нибудь ) он скармливается в родном для компилятора виде через соответствующий xslt-фильтр.

Что это дает? Кроме необходимости использовать фильтры?

> а как это отображается на файловую систему -- дело десятое. посмотрите как это сделано в том же leo.

Лучше расскажи, я его все-равно качать не буду.

* ()
[#] Ответ на: Re: Re: Re: Re: Qecho от anonymous 04.11.2004 12:50:41  

Re: Re: Re: Re: Re: Qecho

Это шутка? Если нет, то какая система и с каким сервиспаком такое поддерживает?

* ()
[#] Ответ на: Re: Re: Re: Re: Re: Использование Unicode в Linux от anonymous 04.11.2004 10:14:55  
init

Re: Re: Re: Re: Re: Re: Использование Unicode в Linux

> От ить упертый. В пожатом виде - СТОЛЬКО ЖЕ.

Да неужели??? А ты попробуй сожми - сильно удивишься.

***** ()
[#] Ответ на: Re: Re: Re: Re: Re: Re: Использование Unicode в Linux от init 04.11.2004 17:22:32  

Re: Re: Re: Re: Re: Re: Re: Использование Unicode в Linux

Пробавал мил человек, пробовал. Разница не более 15%. Проверь сам.

anonymous ()
[#] Ответ на: Re: Re: Re: Re: Re: Re: Re: Использование Unicode в Linux от anonymous 04.11.2004 17:49:31  
init

Re: Re: Re: Re: Re: Re: Re: Re: Использование Unicode в Linux

> Пробавал мил человек, пробовал. Разница не более 15%. Проверь сам.

Так не надо тогда писать "СТОЛЬКО ЖЕ"

***** ()
[#] Ответ на: Re: Re: Re: Re: Re: Re: Re: Re: Использование Unicode в Linux от init 04.11.2004 21:28:53  

Re: Re: Re: Re: Re: Re: Re: Re: Re: Использование Unicode в Linux

> Так не надо тогда писать "СТОЛЬКО ЖЕ"

Плюс-минус 15% - это СТОЛЬКО ЖЕ. Не СТОЛЬКО ЖЕ - это "в четыре раза". Или хотя бы в два.

anonymous ()
[#] Ответ на: Re: Re: Re: Re: Re: Re: Re: Re: Re: Использование Unicode в Linux от anonymous 05.11.2004 5:15:50  
init

Re: Re: Re: Re: Re: Re: Re: Re: Re: Re: Использование Unicode в Linux

> Плюс-минус 15% - это СТОЛЬКО ЖЕ. Не СТОЛЬКО ЖЕ - это "в четыре раза". Или хотя бы в два.

Инетересная логика.. Есть у меня 4 гига исходников. Если бы это был 4-хбайтовая кодировка, это уже было бы 4,5? Ничего себе столько же.

К тому же, например у меня постоянно лежит 2 версии распакованных исходников ядра. Они занимают ~400 мб. И вот это превратится в 1,6Gb! нафиг надо.

***** ()
[#] Ответ на: Re: Re: Re: Qecho от o1o 03.11.2004 22:39:51  

Re: Re: Re: Re: Qecho

>добро пожаловать в 21-ый век. скоро работающих с одним языком остануться единицы.

Как раз наоборот. Компы становятся столь распростаненными, что ими начинают пользоваться даже те, кто с трудом владеет одним языком.
И с каждым годом таких юзеров все больше.

Andy.

anonymous ()
[#] Ответ на: Re: Re: Re: Qecho от anonymous 03.11.2004 23:38:28  

Re: Re: Re: Re: Qecho

>Спасибо, я уж как-нибудь на SuSE с локалью utf8 перебьюсь;)
С прошлого века на koi8-r. Дискомфорта не ощущаю.

anonymous ()
[#] Ответ на: Re: Re: Re: Qecho от jackLucas 04.11.2004 6:34:48  

Re: Re: Re: Re: Qecho

>2. Использовать UCS2 не удобно - придется переконвертировать все имена файлов, текстовые файлы и т.д. в ДВУХбайтовую кодировку!

А для чего тебе UTF8, UCS2 и т.д.? Для того, чтобы обзывать файлы (и содержимое) на разных, а не только английском, языках.
И эти файлы тебе все равно придется перекодировать/переименовывать.
Какая разница сколько перекодировать 1000 файлов или 100000, если это
делать скриптом или прогой?
А после перекодирования - какая тебе разница ВСЕ файлы у тебя будут в 2-байтной кодировке или половина? Тем более, что с 2-х будет быстрее работать и чуть легче программировать.
А смесь двух-четырех байтных символов, ИМХО, - худший вариант. И от многобайтности не избавляет, и 8-битность не оставляет, тормозит, заставляет делать лишние телодвижения при программировании.

anonymous ()
[#] Ответ на: Re: Re: Re: Re: Qecho от anonymous 05.11.2004 13:32:34  

Re: Re: Re: Re: Re: Qecho

>>Спасибо, я уж как-нибудь на SuSE с локалью utf8 перебьюсь;)
>С прошлого века на koi8-r. Дискомфорта не ощущаю.
А дискомфорт появится сразу, если потребуется не только русский и английский, но и еще какой-нибудь другой язык (немецкий там, или французский).
Кроме того, просто не поверю, что тебе не попадались программы, которые бы не работали с koi8-r. Причина вполне понятна, автор программы (американец или там немец) может и не знать о существовании такой кодировки и уж протестировать ее работу точно не может. А вот о существовании utf8 он знает наверняка. И практически все современные программы с ней работают.

anonymous ()
[#] Ответ на: Re: Re: Re: Re: Qecho от anonymous 05.11.2004 13:32:34  

Re: Re: Re: Re: Re: Qecho

> С прошлого века на koi8-r. Дискомфорта не ощущаю.

Какой там код у длинного тире и неразрывного пробела в KOI8-R?

anonymous ()
[#] Ответ на: Re: Re: Re: Re: Re: Qecho от anonymous 05.11.2004 18:09:18  
Evgueni

Re: Re: Re: Re: Re: Re: Qecho

>> С прошлого века на koi8-r. Дискомфорта не ощущаю.

>Какой там код у длинного тире и неразрывного пробела в KOI8-R?

"--- и ~ соответственно.

***** ()
[#] Ответ на: Re: Re: Re: Re: Re: Re: Qecho от Evgueni 05.11.2004 18:47:58  

Re: Re: Re: Re: Re: Re: Re: Qecho

> "--- и ~ соответственно.

<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=KOI8-R" />
</head>
<body>
Любители КОИ-8~"---чмудаки.
</body>
</html>

Как-то странно мозилка этот пробел и тире отобразила...

anonymous ()
[#] Ответ на: Re: Re: Re: Re: Qecho от anonymous 05.11.2004 14:06:48  

Re: Re: Re: Re: Re: Qecho

> А для чего тебе UTF8, UCS2 и т.д.? Для того, чтобы обзывать файлы (и содержимое) на разных, а не только английском, языках.

> И эти файлы тебе все равно придется перекодировать/переименовывать. Какая разница сколько перекодировать 1000 файлов или 100000, если это делать скриптом или прогой?

даже если у меня нет и не будет имён файлов на языках, отличных от английского, всё равно всё переименовывать. + переконвертировать все текстовые файлы в 2/4 байта. Потом появится UCS8 и что? Да здравствует UTF-32! Зачем? UTF-8 со всем прекрасно справляется.

> А после перекодирования - какая тебе разница ВСЕ файлы у тебя будут в 2-байтной кодировке или половина? Тем более, что с 2-х будет быстрее работать и чуть легче программировать.

чуть легче! ширину символов на экране всё равно отслеживать!

программировать можно и с фиксированным числом байт, ввод/вывод UTF-8!

* ()