Теперь в системд будет свой mount - systemd-mount — Talks

Ответ на: комментарий от dexpl 21.08.16 00:59:28 MSK

До этого - виндой. Когда начал переходить на Linux прочитал про настройку локалей. И в той статье было написано, что у Ъ UNIX'оида только один вариант - KOI8-R. Не cp1251 же в самом деле. Ну и вот. Массовый переход на локаль UTF-8 исторически был уже ближе к 2010-му году. В том же ядре default_utf8 выставили в true по умолчанию только в ядре 2.6.24 (январь 2008-го). С тех пор эту переменную необходимо переопределять строчкой в inittab'е:

r2::wait:/bin/echo 0 > /sys/module/vt/parameters/default_utf8

saahriktu ★★★★★
(21.08.16 08:06:56 MSK)

Ответ на: комментарий от kirk_johnson 21.08.16 01:14:07 MSK

Без wchar_t нужно держать под рукой ещё и таблицу модификаторов (диакритика и т.п.) и вручную всё это применять. Возможно это нужно применять вручную и с wchar_t. Я же говорю - цирк ещё тот.

Можно и без юзерского ввода, но тогда нужно чем-то конвертить «char *» в «wchar_t *». А чем именно это делать и можно ли вообще с ходу в этом вашем мраке не разберёшься.

saahriktu ★★★★★
(21.08.16 08:15:32 MSK)
Последнее исправление: saahriktu 21.08.16 08:16:18 MSK (всего исправлений: 1)

Ответ на: комментарий от Chaser_Andrey 21.08.16 01:54:25 MSK

Так я и юзаю собственную сборку на основе LFS'а. Без systemd.

saahriktu ★★★★★
(21.08.16 08:17:20 MSK)

Ссылка

Ответ на: комментарий от saahriktu 21.08.16 08:06:56 MSK

у Ъ UNIX'оида только один вариант - KOI8-R

Даже если родным языком этого "Ъ UNIX'оида" не является русский?

Массовый переход на локаль UTF-8 исторически был уже ближе к 2010-му году.

Вообще-то примерно на 8 лет раньше, с выходом Red Hat Linux 8.0 (Psyche).

С тех пор эту переменную необходимо переопределять

Нет такой необходимости…

строчкой в inittab'е

…как, впрочем, и inittab'а.

dexpl ★★★★★
(21.08.16 08:33:17 MSK)

Ответ на: комментарий от Softwayer 21.08.16 01:24:16 MSK

Ну так это потому что нет в нём никакой «необходимости»

«Не нужность» и то, что «его не хотят возвращать» иллюзия, происходящая из-того, что пользователи для которых инсталятор важен уже как несколько лет назад ушли с дистрибутива.
Смысл инсталятора не в том, чтобы угодить имеющимся пользователям, а в том, чтобы приобрести новых.

Например я ставил Генту, но сопутствующая возня для меня настолько не удобна, что превышает желание гентой пользоваться.

torvn77 ★★★★★
(21.08.16 08:37:59 MSK)
Последнее исправление: torvn77 21.08.16 08:42:05 MSK (всего исправлений: 2)

Ответ на: комментарий от dexpl 21.08.16 08:33:17 MSK

Даже если родным языком этого «Ъ UNIX'оида» не является русский?

Так статья писалась для русскоязычных юзеров.

Вообще-то примерно на 8 лет раньше, с выходом Red Hat Linux 8.0 (Psyche).

Смотря что чем называть. Так-то юникод появился в glibc раньше KOI8-R. Юникод впилили в glibc 2.0.1 (февраль 1997-го), а KOI8-R в 2.1.1 (май 1999-го). Поэтому там где нужно мультибайтовые функции могли задействоваться параллельно с локалью KOI8-R. А вот чтобы локаль UTF-8... Люди, видимо, долго ждали хороших векторных TTF шрифтов. В дистрибутивах начала 2000-х были в основном растровые для KOI8-R. Собственно, и сейчас в ядре действует куча ограничений на PSF шрифты. В т.ч. нельзя поставить шрифт весом более чем 64 Кб. Про кол-во символов вообще молчу. При размере символа 16x30 на однобайтную кодировку хватает, но не более. Так что, в этом смысле Linux к юникоду ещё не готов.

Нет такой необходимости...

У юзеров локали KOI8-R есть.

saahriktu ★★★★★
(21.08.16 08:50:29 MSK)
Последнее исправление: saahriktu 21.08.16 08:53:15 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от DeVliegendeHollander 20.08.16 19:16:56 MSK

То, что он относится к «Ещё пару-тройку лет, и наступит эпоха GNU Systemd (вместо GNU Linux)», а не к «GNU Linux» (т. е. Linux как часть GNU).

~~sudopacman~~ ★★★★★
(21.08.16 09:19:44 MSK)

Ссылка

Ответ на: комментарий от torvn77 21.08.16 08:37:59 MSK

пользователи для которых инсталятор важен уже как несколько лет назад ушли с дистрибутива.
Смысл инсталятора не в том, чтобы угодить имеющимся пользователям

ВП детектед.

Softwayer ★★
(21.08.16 10:15:17 MSK)

Ссылка

Ответ на: комментарий от saahriktu 21.08.16 08:15:32 MSK

Без wchar_t нужно держать под рукой ещё и таблицу модификаторов (диакритика и т.п.) и вручную всё это применять.

man icu.

Можно и без юзерского ввода, но тогда нужно чем-то конвертить «char *» в «wchar_t *». А чем именно это делать и можно ли вообще с ходу в этом вашем мраке не разберёшься.

Почему ты так привязался в wchar_t? Это _НЕ_ Unicode. Это wide character.

~~kirk_johnson~~ ★☆
(21.08.16 10:22:53 MSK)

Ответ на: комментарий от saahriktu 21.08.16 00:29:30 MSK

они должны думать о том как будет удобнее юзерам

Рядового юзера не должно волновать, что у него под капотом. Система должна просто работать и все тут.

Unicode4all ★★★★★
(21.08.16 10:58:52 MSK)
Последнее исправление: Unicode4all 21.08.16 10:59:30 MSK (всего исправлений: 1)

Ответ на: комментарий от kirk_johnson 21.08.16 10:22:53 MSK

Мультибайтовые функции завязаны на wchar_t. Можно, конечно, пробовать парсить юникод однобайтными, но... И выше я критиковал таки тормознутость мультибайтовых функций, которые молотят «wchar_t *».

saahriktu ★★★★★
(21.08.16 11:14:23 MSK)
Последнее исправление: saahriktu 21.08.16 11:14:46 MSK (всего исправлений: 1)

Ответ на: комментарий от Unicode4all 21.08.16 10:58:52 MSK

Не следует путать ламеров с рядовыми юзерами. Рядовой юзер должен сам собрать свою систему из командной строки и написать конфиги руками. А если потом его конфиги начинают игнорироваться, а в системе появляется какой-то троянистый комбайн...

saahriktu ★★★★★
(21.08.16 11:18:40 MSK)
Последнее исправление: saahriktu 21.08.16 11:19:51 MSK (всего исправлений: 1)

Ответ на: комментарий от torvn77 21.08.16 01:17:38 MSK

Пользователи ставят федору/убунту/сусю, где все уже готово
На сервера разворачиавют типовые конфигурации, где тоже уже все настроенно и готово
А если тебе нужно поковырятся - есть гента

mystery ★★
(21.08.16 11:56:12 MSK)

Ссылка

Ответ на: комментарий от saahriktu 21.08.16 00:44:49 MSK

А теперь поставь десктопный софт из популярных
Всякие LibreOffice и т.д.
Начнется срач из кучи директорий

mystery ★★
(21.08.16 11:58:12 MSK)

Ответ на: комментарий от saahriktu 20.08.16 21:08:25 MSK

Почему юникод говно? Что плохого в одной кодировке для всех языков?
Если функции жрут ресурсы, то может дело в том, что они говно?

mystery ★★
(21.08.16 11:59:26 MSK)

Ответ на: комментарий от saahriktu 21.08.16 11:14:23 MSK

Мультибайтовые функции завязаны на wchar_t. Можно, конечно, пробовать парсить юникод однобайтными, но... И выше я критиковал таки тормознутость мультибайтовых функций, которые молотят «wchar_t *».

Во-первых, повторюсь. Это _НЕ_ Unicode. Это wchar. Почему ты пытаешься использовать wide character для Unicode не совсем понятно. В libc нет функций для работы с UTF-8.

Во-вторых, твои бенчмарки показывают только то, что на разных входных данных разные функции показывают разные результаты. Bad science, motherfucker.

~~kirk_johnson~~ ★☆
(21.08.16 12:02:18 MSK)

Ответ на: комментарий от mystery 21.08.16 11:58:12 MSK

Оно требует иксов, которых у меня нет. А вот GNU/Linux таки современный.

saahriktu ★★★★★
(21.08.16 12:07:24 MSK)

Ответ на: комментарий от mystery 21.08.16 11:59:26 MSK

Потому, что то, что можно записать однобайтной кодировкой, занимает больше памяти в юникоде. Да и не готово ядро Linux ещё к юникоду (см. выше).

saahriktu ★★★★★
(21.08.16 12:09:17 MSK)

Ответ на: комментарий от saahriktu 21.08.16 12:09:17 MSK

Потому, что то, что можно записать однобайтной кодировкой, занимает больше памяти в юникоде

Почти во всех современных ляптопах есть 16G RAM. ШЕСТНАДЦАТЬ ГИГАБАЙТ ПАМЯТИ, КАРЛ.

~~kirk_johnson~~ ★☆
(21.08.16 12:13:57 MSK)

Ответ на: комментарий от kirk_johnson 21.08.16 12:02:18 MSK

Это _НЕ_ Unicode. Это wchar

«wide character» - это и есть «символ, который потенциально может весить больше чем 1 байт». То, что и привнесено юникодом.

на разных входных данных

Это одни и теже входные данные, только в разных кодировках. А я про то и говорил. Уже из за одного того, что в UTF-8 текст резко пухнет в байтах, _одну и туже последовательность символов_ становится дольше парсить в байтах. Тормоза by design. Вот если бы байт было бы столько же... Но, это возможно было бы только в том случае если бы юникод был однобайтным. Таким образом от преимуществ однобайтных кодировок никуда не деться.

saahriktu ★★★★★
(21.08.16 12:14:38 MSK)
Последнее исправление: saahriktu 21.08.16 12:16:00 MSK (всего исправлений: 2)

Ответ на: комментарий от saahriktu 21.08.16 12:14:38 MSK

Это одни и теже входные данные, только в разных кодировках. А я про то и говорил. Уже из за одного того, что в UTF-8 текст резко пухнет в байтах, _одну и туже последовательность символов_ становится дольше парсить в байтах. Тормоза by design. Вот если бы байт было бы столько же... Но, это возможно было бы только в том случае если бы юникод был однобайтным. Таким образом от преимуществ однобайтных кодировок никуда не деться.

У тебя дыра в логике. Почини её.

~~kirk_johnson~~ ★☆
(21.08.16 12:19:40 MSK)

Ответ на: комментарий от kirk_johnson 21.08.16 12:13:57 MSK

А у Raspberry Pi 1 256-512 Mb RAM. Ресурсы железа надо экономить, тогда софт будет более кроссплатформенным и им будет приятнее пользоваться. А то понапишут жирного софта которому подавай 16 ядер проца и 32 гига оперативы...

saahriktu ★★★★★
(21.08.16 12:21:07 MSK)

Ответ на: комментарий от saahriktu 21.08.16 12:21:07 MSK

А у Raspberry Pi 1 256-512 Mb RAM. Ресурсы железа надо экономить, тогда софт будет более кроссплатформенным и им будет приятнее пользоваться. А то понапишут жирного софта которому подавай 16 ядер проца и 32 гига оперативы...

Уф... Ладно, давай проще? Ты можешь на RPI запустить git? Можешь. Git использует utf-8 внутри. Всё. Заткнись и добро пожаловать в 21 век.

~~kirk_johnson~~ ★☆
(21.08.16 12:24:05 MSK)

Ответ на: комментарий от kirk_johnson 21.08.16 12:19:40 MSK

Это не дыра, это последовательная логика. Чем больше байт тем их дольше парсить. Так? Так. Одна и таже последовательность символов в KOI8-R и UTF-8 занимает разное кол-во байт. Так? Так. Ну и вот.

saahriktu ★★★★★
(21.08.16 12:25:53 MSK)

Ответ на: комментарий от upcFrost 20.08.16 19:02:03 MSK

Ну там же можно сделать и системд. Хотя бы для повышения скиллов в работе с ним, поскольку в вакансиях чаще встречается знание центоси. Думаю, что имеет смысл держать хотя бы одну генту с системд как способ избежать установки чего-то другого. Было бы интересно узнать об опыте тех, кто использует systemd-mount в генте. Ждем ебилдов.

Deleted
(21.08.16 12:30:48 MSK)
Последнее исправление: Deleted 21.08.16 12:40:43 MSK (всего исправлений: 4)

Ссылка

Ответ на: комментарий от saahriktu 21.08.16 11:18:40 MSK

Рядовой юзер должен сам собрать свою систему из командной строки и написать конфиги руками.

Машина должна служить человеку, а не наоборот. И да, командный интерфейс пытались закопать еще во времена Windows 3.x

Unicode4all ★★★★★
(21.08.16 12:33:15 MSK)

Ответ на: комментарий от kirk_johnson 21.08.16 12:24:05 MSK

git можно и не запускать. Да и сама по себе внутренняя отсылка к юникоду ещё почти ничего не означает. В glibc юникод появился раньше чем KOI8-R, и для glibc KOI8-R выглядит как набор символов юникода. Но, тем менее, есть локаль KOI8-R, которая позволяет работать с текстами в KOI8-R - создавать, читать, парсить,... А меньшее кол-во байт текста - быстрее обрабатывать и удобнее хранить.

saahriktu ★★★★★
(21.08.16 12:36:40 MSK)
Последнее исправление: saahriktu 21.08.16 12:36:58 MSK (всего исправлений: 1)

Ответ на: комментарий от saahriktu 21.08.16 12:25:53 MSK

Это не дыра, это последовательная логика. Чем больше байт тем их дольше парсить. Так? Так. Одна и таже последовательность символов в KOI8-R и UTF-8 занимает разное кол-во байт. Так? Так. Ну и вот.

Да нет, это именно что дыра. Ты говоришь, что _функции_ тормозят. Нет, функции не тормозят. Входных данных (в некоторых случаях) больше. Функции тут не при чем.

~~kirk_johnson~~ ★☆
(21.08.16 12:38:52 MSK)

Ответ на: комментарий от saahriktu 21.08.16 12:36:40 MSK

git можно и не запускать. Да и сама по себе внутренняя отсылка к юникоду ещё почти ничего не означает. В glibc юникод появился раньше чем KOI8-R, и для glibc KOI8-R выглядит как набор символов юникода. Но, тем менее, есть локаль KOI8-R, которая позволяет работать с текстами в KOI8-R - создавать, читать, парсить,... А меньшее кол-во байт текста - быстрее обрабатывать и удобнее хранить.

удобнее хранить

ААААААААААААААААААХАХАХАХАХАХАХАХАХАХАХАХА.

~~kirk_johnson~~ ★☆
(21.08.16 12:39:31 MSK)

Ссылка

Ответ на: комментарий от Unicode4all 21.08.16 12:33:15 MSK

Человек не умеет должным образом пользоваться тем, что не собрано его руками. Так что, нужно сначала собрать, а только потом пользоваться.

Мало ли кто там что пытался. Командная строка рулит и всегда будет рулить.

saahriktu ★★★★★
(21.08.16 12:42:50 MSK)

Ответ на: комментарий от kirk_johnson 21.08.16 12:38:52 MSK

Входных данных (в некоторых случаях) больше

Ну так из за юникода же. Чтобы юникодные функции не тормозили они должны парсить быстрее чем однобайтные. Иначе это тормоза by design.

saahriktu ★★★★★
(21.08.16 12:50:37 MSK)
Последнее исправление: saahriktu 21.08.16 12:51:07 MSK (всего исправлений: 1)

Ответ на: комментарий от saahriktu 21.08.16 12:50:37 MSK

ИМХО:
1)Уже вышел RPI2
2)RPI в моём понимании это либо терминал, либо браузер или видиоплеер, и там и там скорость обработки юникода не должна быть критичной.

torvn77 ★★★★★
(21.08.16 12:54:21 MSK)

Ответ на: комментарий от saahriktu 21.08.16 12:50:37 MSK

Ну так из за юникода же. Чтобы юникодные функции не тормозили они должны парсить быстрее чем однобайтные. Иначе это тормоза by design.

Чувак, если скормишь эту строку strlen, strlen тоже будет работать дольше. strlen тормозит?

~~kirk_johnson~~ ★☆
(21.08.16 12:56:16 MSK)

Ответ на: комментарий от saahriktu 21.08.16 12:42:50 MSK

Мало ли кто там что пытался. Командная строка рулит и всегда будет рулить.

Картиночки ты тоже в консоли рисуешь?

~~kirk_johnson~~ ★☆
(21.08.16 12:56:49 MSK)

Ответ на: комментарий от torvn77 21.08.16 12:54:21 MSK

Так реализация нативной консоли в ядре Linux ещё не готова к шрифтам больше чем 64 Кб. Ну будут показываться символы однобайтной кодировки, а остальные «квадратами» - что это поменяет? А так тот же lynx адаптирует ряд юникодных символов к KOI8-R. Например, звёзды на ЛОРе у меня отображаются символами '*'. Да и в памяти тексты в юникоде займут больше места, а памяти там и так мало.

saahriktu ★★★★★
(21.08.16 13:04:35 MSK)

Ответ на: комментарий от kirk_johnson 21.08.16 12:56:16 MSK

Так однобайтным функциям нужно скармливать строки в однобайтных кодировках, например KOI8-R. А это меньше байт чем в UTF-8.

Ещё раз повторяю, что я говорю про конкретные последовательности символов. Если мы одну и туже последовательность символов конвертируем и в KOI8-R и в UTF-8, то получается разное кол-во байт. _При текстах в KOI8-R меньше байт нужно парсить_. А _при тех же самых последовательностях символов в UTF-8 парсить больше_. И от этого никуда не деться.

Человек-то работает с конкретными последовательностями символов. И мне, например, не надо обрывка строки, который вмещается в выделенные N байт, а потому парсится с той же скоростью что и N символов в однобайтной кодировке. Строки нужно парсить полностью. А потому и сравнивать производительность нужно не по байтам, а по кол-ву символов. Независимо от кодировок.

saahriktu ★★★★★
(21.08.16 13:12:19 MSK)
Последнее исправление: saahriktu 21.08.16 13:13:19 MSK (всего исправлений: 1)

Ответ на: комментарий от saahriktu 21.08.16 13:04:35 MSK

нативной консоли в ядре Linux

Нативная консоль в ядре Linux нужна только для того, чтобы починить упавшую систему.

Unicode4all ★★★★★
(21.08.16 13:12:30 MSK)

Ответ на: комментарий от Unicode4all 21.08.16 13:12:30 MSK

Нет, она нужна чтобы в ней жить без иксов.

saahriktu ★★★★★
(21.08.16 13:14:01 MSK)

Ответ на: комментарий от saahriktu 21.08.16 13:12:19 MSK

Отлично, ты наконец-то пришел к тому, что тормозят не функции. Едем дальше. А теперь нам нужно разобраться, в каком конкретно случае ты заметишь ощутимую разницу между utf-8 и koi8-r.

~~kirk_johnson~~ ★☆
(21.08.16 13:16:25 MSK)

Ответ на: комментарий от saahriktu 21.08.16 13:14:01 MSK

Нет, она нужна чтобы в ней жить без иксов.

За что ты себя так ненавидишь?

~~kirk_johnson~~ ★☆
(21.08.16 13:16:54 MSK)

Ответ на: комментарий от saahriktu 21.08.16 00:47:09 MSK

В GNOME и реестр есть, и это тоже плохо.

А что плохого в реестрообразном хранении конфигурации? Не обязательно же переносить все недостатки виндовой версии.

ls-h ★★★★★
(21.08.16 13:18:30 MSK)

Ответ на: комментарий от ls-h 21.08.16 13:18:30 MSK

А что плохого в реестрообразном хранении конфигурации? Не обязательно же переносить все недостатки виндовой версии.

А что хорошего?

~~kirk_johnson~~ ★☆
(21.08.16 13:19:13 MSK)

Ответ на: комментарий от kirk_johnson 21.08.16 12:56:49 MSK

Какие «картиночки»? Я рисую псевдографикой.

saahriktu ★★★★★
(21.08.16 13:21:24 MSK)

Ответ на: комментарий от saahriktu 21.08.16 13:21:24 MSK

Какие «картиночки»? Я рисую псевдографикой.

Повторюсь: за что ты себя так ненавидишь?

~~kirk_johnson~~ ★☆
(21.08.16 13:22:04 MSK)

Ссылка

Ответ на: комментарий от ls-h 21.08.16 13:18:30 MSK

В бинарности. Конфиги должны быть в человекочитаемом plaintext'е.

saahriktu ★★★★★
(21.08.16 13:22:15 MSK)

Ответ на: комментарий от kirk_johnson 21.08.16 13:19:13 MSK

Удобнее для машинной обработки чем простыни текста.

Unicode4all ★★★★★
(21.08.16 13:22:31 MSK)

Ответ на: комментарий от Unicode4all 21.08.16 13:22:31 MSK

Удобнее для машинной обработки чем простыни текста.

Неудобнее для сисадмина, который это все конфигурит. Многие программы (e.g. nftables) реализуют собственный DSL для конфигурации. Пихать его в key-value будет довольно неудобно. Ну или правила для logrotate.

~~kirk_johnson~~ ★☆
(21.08.16 13:23:40 MSK)
Последнее исправление: kirk_johnson 21.08.16 13:24:33 MSK (всего исправлений: 1)

Ответ на: комментарий от torvn77 20.08.16 19:39:12 MSK

чем с БД с неясными и не ведомыми ключами

Можно же «объединить» справку (man/info/howto) с реестром/БД. Открыл ветку, а сбоку справка по всем параметрам. Это может получиться даже лучше, чем man-ы.

ls-h ★★★★★
(21.08.16 13:25:04 MSK)

Ответ на: комментарий от kirk_johnson 21.08.16 13:16:25 MSK

В случае обработки сотен тысяч текстовых файлов конечно же. Но, это по производительности. А по жручести памяти всё произойдёт гораздо быстрее. Тем более что часто проще дампить кучу текста не по разным текстовым файлам, а в один. Так получаются текстовые файлы на много гигабайт (в KOI8-R). А если ещё начать работать с несколькими параллельно...

saahriktu ★★★★★
(21.08.16 13:25:42 MSK)

Ответ на: комментарий от ls-h 21.08.16 13:25:04 MSK

Можно же «объединить» справку (man/info/howto) с реестром/БД. Открыл ветку, а сбоку справка по всем параметрам. Это может получиться даже лучше, чем man-ы.

Ну, man'ы описывают не только опции конфигурации.

~~kirk_johnson~~ ★☆
(21.08.16 13:26:01 MSK)

Похожие темы