LINUX.ORG.RU
ФорумTalks

Slackware, man и UTF-8

 , ,


2

2

Как известно, официальный пакет man в Slackware до сих пор ожидает, что у юзера будет локаль KOI8-R. Существуют варварские мануалы прежних лет, которые описывают сборку утилиты man с установкой в систему без опакечивания. А всего-то надо было добавить 3 строчки в слакбилд.

Вот он, патченный слакбилд, который собирает пакет man с поддержкой локали ru_RU.UTF-8: https://github.com/saahriktu/modified-slackbuilds/tree/master/man .

После этого, в соответствии с документацией, остаётся пошаманить с опциями NROFF в /etc/man.conf. Рекомендуется, например, это:

NROFF           iconv -f utf8 -t koi8r | /usr/bin/nroff -Tlatin1 -mandoc -c | iconv -f koi8r -t utf8

Enjoy!

★★★★★

Всё понятно, главное — не волнуйтесь. Отвечайте на вопросы только да или нет — у вас дома вооружённые люди и они угрожают вам?

redgremlin ★★★★★
()

официальный пакет man в Slackware до сих пор ожидает, что у юзера будет локаль KOI8-R

Вот он, патченный слакбилд, который собирает пакет man с поддержкой локали ru_RU.UTF-8

Ты не заболел?

h578b1bde ★☆
()
Ответ на: комментарий от takino

Да не бзди, у пацана просто фишак такой, типа он кодировочный еретик-некрофил, осуществляющий и пропагандирующий ритуальные соития глаз человека с мертвыми кодировками.

Sociopsih ★☆
()
Ответ на: комментарий от upcFrost

ты что, пил?

Нет. Купил Raspberry Pi 3 и поставил туда Slackware ARM. С иксами. На ноуте тоже Слака с иксами. А против использования UTF-8 в иксах я никогда не возражал. Это в ядерной консоли со шрифтами в 256 символов альтернатив однобайтным кодировкам нет просто потому, что в таких условиях однобайтные кодировки удобнее.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от veschestvo

Там суть в вот этом:

iconv -f koi8-r -t utf-8 msgs/mess.ru > /tmp/mess.ru
mv /tmp/mess.ru ./msgs/
echo "$ codeset=UTF-8" > msgs/mess.ru.codeset
А этих строчек в слакбилде в current ветке нет. И версия man-db там такая же.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Так скоро переход и будет. Я всё жду перехода на qt5. Я надеюсь на стабилизацию gtk+3.

veschestvo
()

Модераторы, проверьте не угнал ли акк.

petrosyan ★★★★★
()

Рекомендуется, например, это

Неправда ваша, барин, рекомендуется:

NROFF   /usr/bin/groff -Dutf8 -Tutf8 -mandoc

bormant ★★★★★
()
Ответ на: комментарий от StReLoK

Вынесите Эдика. Негоже в хоромы царские фекалии всякие вносить.

cantus
()

Надо забанить ТСа, кажется его акк угнали.

Unicode4all ★★★★★
()
Ответ на: комментарий от saahriktu

против использования UTF-8
альтернатив однобайтным кодировкам нет

А теперь попробуй подумать тем, что у нормальных людей содержит моск:

Что означает цифра 8 а названии кодировки UTF-8? Что означает эта же цифра в названии кодировки KOI8-R? Нет-ли здесь некоего соврадения?

zabbal ★★★★★
()
Ответ на: комментарий от zabbal

Нет-ли здесь некоего соврадения?

Только в ASCII. А вот дальше начинаются большие различия. В KOI8-R коды 128-255 относятся к одному из 128-ми символов за пределами ASCII. А в UTF-8 часть битов в кодах 128-255 указывает на длину последовательности байт часть битов в которых относится к коду символа. И эта последовательность байтов в соответствии со старым стандартом может быть до 6-ти байт. Свежие примеры работы с UTF-8 говорят о том, что это устарело, и показывают как работать с последовательностями до 4-х байт.

saahriktu ★★★★★
() автор топика

Вот тут и я приперся. Поагитирую слегка. Попробуй Crux. Чай краше Слаки. Изящнее, что ли. Да и мейнтейнеры к таким пользователям благосклонны (да да, даже к таким, как я).

vombat
()
Ответ на: комментарий от Deleted

Теперь, вероятно, будет в немного другом формате, но будет. Постараюсь к осени выпустить пилотный номер.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Я в шоке.

Просто нет слов...

В консоли utf-8 удобен, если есть дрова на видео.

А на серве с s3trio у меня таки стоит koi8...

timdorohin ★★★★
()

UTF-8
saahriktu

Я же вроде ничего не упарывал.

awesomebuntu
()
Ответ на: комментарий от saahriktu

эта последовательность байтов в соответствии со старым стандартом может быть до 6-ти байт. Свежие примеры работы с UTF-8 говорят о том, что это устарело, и показывают как работать с последовательностями до 4-х байт.

UTF-8 - это способ кодирования чисел в диапазоне от 0 до 0x7FFFFFFF так, чтобы числа от 0 до 0x7F (диапазон ASCII) кодировались одним байтом. Но в стандарте UNICODE символы могут иметь коды в диапазоне от 0 до 0x10FFFF. Этот поддиапазон в UTF-8 кодируется не более чем 4 байтами.

German_1984 ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.