Использование Unicode в Linux

0

0

Статья посвящена вопросам связанным с использованием unicode в Linux.

Рассматриваются такие вопросы как:
* установка правильной локали
* преобразование файловых систем (названий файлов)
* преобразование текстовых файлов
* где взять unicode шрифты

В конце статьи даются ссылки на другие полезные ресурсы посвященные вопросам использования unicode

>>> Подробности

Ссылка

← OpenBSD Team объявила об окончании поддержки OpenBSD 3.4, вышедшей чуть меньше года назад.

Вышел XML редактор Conglomerate 0.7.15 →

← 1 2 →

Ответ на: комментарий от amm 04.11.04 10:31:12 MSK

> Зачем в ядре уникод? Где оно, вообще, с текстом работает? ну, засунуть в ядро уникод стоит хотя бы для того чтобы посмотреть что будет твориться на лор :)))

а в придачу еще и xml

anonymous
(04.11.04 12:36:19 MSK)

Ссылка

Ответ на: комментарий от anonymous 04.11.04 08:48:43 MSK

>>> Кто нибудь видел utf16 или UCS2 локали?

>> даа. и не только видел. и даже работает. винду поставь.:-)

> А как их в консоли включить?

chcp 10646

anonymous
(04.11.04 12:50:41 MSK)

Ответ на: комментарий от anonymous 04.11.04 12:31:50 MSK

> очень просто. в зюмеле хранится юникод. компилятору (или что у вас там -- интерпретатор, groff какой-нибудь ) он скармливается в родном для компилятора виде через соответствующий xslt-фильтр.

Что это дает? Кроме необходимости использовать фильтры?

> а как это отображается на файловую систему -- дело десятое. посмотрите как это сделано в том же leo.

Лучше расскажи, я его все-равно качать не буду.

amm ★★
(04.11.04 13:57:59 MSK)

Ссылка

Ответ на: комментарий от anonymous 04.11.04 12:50:41 MSK

Это шутка? Если нет, то какая система и с каким сервиспаком такое поддерживает?

amm ★★
(04.11.04 13:59:05 MSK)

Ссылка

Ответ на: комментарий от anonymous 04.11.04 10:14:55 MSK

> От ить упертый. В пожатом виде - СТОЛЬКО ЖЕ.

Да неужели??? А ты попробуй сожми - сильно удивишься.

init ★★★★★
(04.11.04 17:22:32 MSK)

Ответ на: комментарий от init 04.11.04 17:22:32 MSK

Пробавал мил человек, пробовал. Разница не более 15%. Проверь сам.

anonymous
(04.11.04 17:49:31 MSK)

Ответ на: комментарий от anonymous 04.11.04 17:49:31 MSK

> Пробавал мил человек, пробовал. Разница не более 15%. Проверь сам.

Так не надо тогда писать "СТОЛЬКО ЖЕ"

init ★★★★★
(04.11.04 21:28:53 MSK)

Ответ на: комментарий от init 04.11.04 21:28:53 MSK

> Так не надо тогда писать "СТОЛЬКО ЖЕ"

Плюс-минус 15% - это СТОЛЬКО ЖЕ. Не СТОЛЬКО ЖЕ - это "в четыре раза". Или хотя бы в два.

anonymous
(05.11.04 05:15:50 MSK)

Ответ на: комментарий от anonymous 05.11.04 05:15:50 MSK

> Плюс-минус 15% - это СТОЛЬКО ЖЕ. Не СТОЛЬКО ЖЕ - это "в четыре раза". Или хотя бы в два.

Инетересная логика.. Есть у меня 4 гига исходников. Если бы это был 4-хбайтовая кодировка, это уже было бы 4,5? Ничего себе столько же.

К тому же, например у меня постоянно лежит 2 версии распакованных исходников ядра. Они занимают ~400 мб. И вот это превратится в 1,6Gb! нафиг надо.

init ★★★★★
(05.11.04 06:47:26 MSK)

Ссылка

Ответ на: комментарий от o1o 03.11.04 22:39:51 MSK

>добро пожаловать в 21-ый век. скоро работающих с одним языком остануться единицы.

Как раз наоборот. Компы становятся столь распростаненными, что ими начинают пользоваться даже те, кто с трудом владеет одним языком.
И с каждым годом таких юзеров все больше.

Andy.

anonymous
(05.11.04 13:27:45 MSK)

Ссылка

Ответ на: комментарий от anonymous 03.11.04 23:38:28 MSK

>Спасибо, я уж как-нибудь на SuSE с локалью utf8 перебьюсь;)
С прошлого века на koi8-r. Дискомфорта не ощущаю.

anonymous
(05.11.04 13:32:34 MSK)

Ответ на: комментарий от jackLucas 04.11.04 06:34:48 MSK

>2. Использовать UCS2 не удобно - придется переконвертировать все имена файлов, текстовые файлы и т.д. в ДВУХбайтовую кодировку!

А для чего тебе UTF8, UCS2 и т.д.? Для того, чтобы обзывать файлы (и содержимое) на разных, а не только английском, языках.
И эти файлы тебе все равно придется перекодировать/переименовывать.
Какая разница сколько перекодировать 1000 файлов или 100000, если это
делать скриптом или прогой?
А после перекодирования - какая тебе разница ВСЕ файлы у тебя будут в 2-байтной кодировке или половина? Тем более, что с 2-х будет быстрее работать и чуть легче программировать.
А смесь двух-четырех байтных символов, ИМХО, - худший вариант. И от многобайтности не избавляет, и 8-битность не оставляет, тормозит, заставляет делать лишние телодвижения при программировании.

anonymous
(05.11.04 14:06:48 MSK)

Ответ на: комментарий от anonymous 05.11.04 13:32:34 MSK

>>Спасибо, я уж как-нибудь на SuSE с локалью utf8 перебьюсь;)
>С прошлого века на koi8-r. Дискомфорта не ощущаю.
А дискомфорт появится сразу, если потребуется не только русский и английский, но и еще какой-нибудь другой язык (немецкий там, или французский).
Кроме того, просто не поверю, что тебе не попадались программы, которые бы не работали с koi8-r. Причина вполне понятна, автор программы (американец или там немец) может и не знать о существовании такой кодировки и уж протестировать ее работу точно не может. А вот о существовании utf8 он знает наверняка. И практически все современные программы с ней работают.

anonymous
(05.11.04 14:59:55 MSK)

Ссылка

Ответ на: комментарий от anonymous 05.11.04 13:32:34 MSK

> С прошлого века на koi8-r. Дискомфорта не ощущаю.

Какой там код у длинного тире и неразрывного пробела в KOI8-R?

anonymous
(05.11.04 18:09:18 MSK)

Ответ на: комментарий от anonymous 05.11.04 18:09:18 MSK

>> С прошлого века на koi8-r. Дискомфорта не ощущаю.

>Какой там код у длинного тире и неразрывного пробела в KOI8-R?

"--- и ~ соответственно.

Evgueni ★★★★★
(05.11.04 18:47:58 MSK)

Ответ на: комментарий от Evgueni 05.11.04 18:47:58 MSK

> "--- и ~ соответственно.

<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=KOI8-R" />
</head>
<body>
Любители КОИ-8~"---чмудаки.
</body>
</html>

Как-то странно мозилка этот пробел и тире отобразила...

anonymous
(05.11.04 23:38:50 MSK)

Ссылка

Ответ на: комментарий от anonymous 05.11.04 14:06:48 MSK

> А для чего тебе UTF8, UCS2 и т.д.? Для того, чтобы обзывать файлы (и содержимое) на разных, а не только английском, языках.

> И эти файлы тебе все равно придется перекодировать/переименовывать. Какая разница сколько перекодировать 1000 файлов или 100000, если это делать скриптом или прогой?

даже если у меня нет и не будет имён файлов на языках, отличных от английского, всё равно всё переименовывать. + переконвертировать все текстовые файлы в 2/4 байта. Потом появится UCS8 и что? Да здравствует UTF-32! Зачем? UTF-8 со всем прекрасно справляется.

> А после перекодирования - какая тебе разница ВСЕ файлы у тебя будут в 2-байтной кодировке или половина? Тем более, что с 2-х будет быстрее работать и чуть легче программировать.

чуть легче! ширину символов на экране всё равно отслеживать!

программировать можно и с фиксированным числом байт, ввод/вывод UTF-8!

jackLucas ★
(07.11.04 06:02:10 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

← OpenBSD Team объявила об окончании поддержки OpenBSD 3.4, вышедшей чуть меньше года назад.

Linux General

Вышел XML редактор Conglomerate 0.7.15 →

Похожие темы