Обновлён скрипт для pip'а, который дружит его с KOI8-R

0

1

Сабж. Теперь в новом более универсальном формате.

Внезапно обнаружил, что в конце октября выходил Python 3.7.1. А в его составе pip 10.0.1. Значит, мои старые скрипты уже внезапно устарели.

Однако, я взял один из старых скриптов и допилил его до patch_any_pip_for_koi8-r-0.1.sh.

Напоминаю, некоторое время назад разработчики Python'а стали жёстко прописывать UTF-8 в pip, в результате чего при сборке и установке Python'а pip начал падать при попытке чтения дистрибутивной информации если локаль отличается от UTF-8. А мои скрипты устраняют эту проблему для локали KOI8-R.

Скачать: gopher://sdf.org/9/users/saahriktu/saahriktu.org/patches/patch_any_pip_for_koi8-r-0.1.sh.lzma (248 байт)

Скрипт запускается прямо в корне исходников.

Ссылка

← Хочется коробочку для дома

Linux в Dex | SAMSUNG →

Угадал автора по заголовку.

karton1 ★★★★★
(14.11.18 18:21:19 MSK)

Ссылка

Ник nenuzhno свободен. Чего ждут модераторы? Пора уже называть героев своими именами.

Deleted
(14.11.18 18:30:22 MSK)

Ссылка

Назови 3 причины зачем это нужно.

gopher://sdf.org/9/users/saahriktu/saahriktu.org/patches/patch_any_pip_for_koi8-r-0.1.sh.lzma (248 байт)

В браузере не открывается.

Deleted
(14.11.18 18:32:44 MSK)

Ответ на: комментарий от Deleted 14.11.18 18:32:44 MSK

Я же написал одну, но вескую причину: это нужно чтобы собрать и установить Python с pip'ом при локали KOI8-R.

В браузере не открывается.

Качать так:

curl gopher://sdf.org/9/users/saahriktu/saahriktu.org/patches/patch_any_pip_for_koi8-r-0.1.sh.lzma > patch_any_pip_for_koi8-r-0.1.sh.lzma

saahriktu ★★★★★
(14.11.18 18:35:39 MSK) автор топика

а в апстрим приняли?

Harald ★★★★★
(14.11.18 18:37:22 MSK)

Ответ на: комментарий от Harald 14.11.18 18:37:22 MSK

В апстриме UTF-8 во все поля.

saahriktu ★★★★★
(14.11.18 18:37:57 MSK) автор топика

Ответ на: комментарий от saahriktu 14.11.18 18:37:57 MSK

понятно

Harald ★★★★★
(14.11.18 18:38:19 MSK)

Ссылка

Зачем тебе python 3.7, если есть прекрасный 2.6?

grem ★★★★★
(14.11.18 18:41:36 MSK)

Ответ на: комментарий от saahriktu 14.11.18 18:35:39 MSK

curl -O ты не используешь, тоже то-же из-за UTF-8 ?

Dred ★★★★★
(14.11.18 18:42:12 MSK)

Ответ на: комментарий от saahriktu 14.11.18 18:35:39 MSK

Я же написал одну, но вескую причину: это нужно чтобы собрать и установить Python с pip'ом при локали KOI8-R.

Вот это зачем?

Deleted
(14.11.18 18:45:22 MSK)

Ответ на: комментарий от grem 14.11.18 18:41:36 MSK

Я собираю коллекцию Python'ов:

> ls -1 /usr/bin/python?.?
/usr/bin/python1.6
/usr/bin/python2.7
/usr/bin/python3.7
>

А если серьёзно, то из LFS'а 2-й Python уже выкинули.

saahriktu ★★★★★
(14.11.18 18:45:27 MSK) автор топика
Последнее исправление: saahriktu 14.11.18 18:46:11 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Deleted 14.11.18 18:45:22 MSK

Это нужно юзерам локали KOI8-R.

saahriktu ★★★★★
(14.11.18 18:47:19 MSK) автор топика

Ответ на: комментарий от Dred 14.11.18 18:42:12 MSK

Суть не меняется.

saahriktu ★★★★★
(14.11.18 18:47:59 MSK) автор топика

Ответ на: комментарий от saahriktu 14.11.18 18:47:19 MSK

Это нужно юзеру локали KOI8-R.

Поправил.

mord0d ★★★★★
(14.11.18 18:48:24 MSK)

Ссылка

Отпишись, если тебе кто пришлёт «спасибо» за скрипт.

grem ★★★★★
(14.11.18 18:50:20 MSK)

Ссылка

Ответ на: комментарий от saahriktu 14.11.18 18:47:59 MSK

Как это. Байтов в строке меньше, это же ты их экономишь.

Dred ★★★★★
(14.11.18 18:53:28 MSK)

Ссылка

Зачем локаль KOI8-R? Это что за дистрибутив, где это – суровая необходимость?

Octagon ★
(14.11.18 19:05:55 MSK)

Ответ на: комментарий от Octagon 14.11.18 19:05:55 MSK

Почему сразу «необходимость»? Это может быть свободный выбор юзера потому, что ему так удобнее.

У однобайтных кодировок много плюсов, а у юникода много минусов.

saahriktu ★★★★★
(14.11.18 19:13:06 MSK) автор топика

Ссылка

óÐÁÓÉÂÏ, ÐÏÌÅÚÎÙÊ ÐÁÔÞ!

Deleted
(14.11.18 19:15:11 MSK)

Ссылка

Ответ на: комментарий от Octagon 14.11.18 19:05:55 MSK

Зачем локаль KOI8-R? Это что за дистрибутив, где это – суровая необходимость?

это сто раз обсуждали уже.

не, понятно что есть куча всего ненужно, сустемдики всякие, эмоджи и джаваскрипты и весь современный говновеб, потому что это не приносит ничего нового, никаких вопросов не решает, зато создает целую говноиндустрию. но понять почему юникод не нужен, который решает проблемы, а я помню как с этими локалями в лялихе в 90х были проблемы, с шрифтами и прочим, не важно, короче мне не ясен смысл пользовать кои8, героически преодолевать 33 трудности и тд и тп.

в если говорить про память - да говновеб вне конкуренции, открыл банк клиент и похеру что ты там 50kb поэкономил на ядреной консоли.

alwayslate ★★
(14.11.18 19:51:21 MSK)

Ссылка

Как_я_троллю_ЛОР_на_протяжении_четырёх_лет_после_ухода_эдички.lzma

~~EXL~~ ★★★★★
(14.11.18 20:21:50 MSK)

Ответ на: комментарий от EXL 14.11.18 20:21:50 MSK

А я сейчас на полном серьёзе опять пишу из ядерной консоли с локалью KOI8-R.

Развернул LFS в честь починки ядерной консоли в ядре 4.19.2. Сижу сейчас с этим самым ядром. И думаю что делать со своими проектами дальше.

Может и ну его их пересматривать. Юзать ядерную консоль всё-таки у меня получается лучше всего. Надо подумать...

http://saahriktu.org/tmp/scr1542217028.png

saahriktu ★★★★★
(14.11.18 20:28:37 MSK) автор топика

Ответ на: комментарий от saahriktu 14.11.18 20:28:37 MSK

чем «скриншоты» делаешь в консоли-то :)

Harald ★★★★★
(14.11.18 20:42:35 MSK)

koi8-r

gopher

Двойное трололо!

ya-betmen ★★★★★
(14.11.18 20:46:03 MSK)

Ссылка

Ответ на: комментарий от Harald 14.11.18 20:42:35 MSK

fbgrab жи есть

И ещё fbdump. Я вот делал:

http://esxi.z-lab.me:666/~exl_lab/screens/qbittorent_fb0_console.png

~~EXL~~ ★★★★★
(14.11.18 20:52:24 MSK)
Последнее исправление: EXL 14.11.18 20:53:46 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Harald 14.11.18 20:42:35 MSK

Своими скриптами. Этот конкретный скрипт использует fbdump.

saahriktu ★★★★★
(14.11.18 21:10:48 MSK) автор топика

Ссылка

Теперь в новом более универсальном формате

В формате UTF-8?

~~te111011010~~ ★
(14.11.18 21:27:09 MSK)

Ответ на: комментарий от te111011010 14.11.18 21:27:09 MSK

В ASCII. Но, теперь с детектором версии pip'а. Раньше была вписана конкретная версия.

saahriktu ★★★★★
(14.11.18 21:32:02 MSK) автор топика

Ссылка

Ответ на: комментарий от saahriktu 14.11.18 20:28:37 MSK

А, ладно, признаю, что однобайтные кодировки устарели, и без юникода и графических сред сегодня никуда.

saahriktu ★★★★★
(15.11.18 11:02:17 MSK) автор топика

Ответ на: комментарий от saahriktu 15.11.18 11:02:17 MSK

ВОТ ЭТО ПОВОРОТ

Deleted
(15.11.18 11:52:59 MSK)

Не буду говорить о нужности самого скрипта, но скажу, что

cd ../../..

В конце скрипта не нужно точно, ибо по выходу тебя всё равно выплюнет в cwd, который был до запуска.

Deleted
(15.11.18 11:56:58 MSK)

Ссылка

Ответ на: комментарий от EXL 14.11.18 20:21:50 MSK

А что, Эдик четыре года назад ушел? Как время летит... Кажется только недавно это было.

otto ★★★★
(15.11.18 12:33:50 MSK)

Ссылка

Ответ на: комментарий от saahriktu 14.11.18 20:28:37 MSK

http://saahriktu.org/tmp/scr1542217028.png

Не боишься полной потери зрения?

dexpl ★★★★★
(15.11.18 12:47:53 MSK)

gopher://sdf.org/9/users/saahriktu/saahriktu.org/patches/patch_any_pip_for_koi8-r-0.1.sh.lzma (248 байт)

gopher://
patch_any_pip_for_koi8-r
.lzma

Не чокаясь...

proud_anon ★★★★★
(15.11.18 18:22:20 MSK)

Ссылка

Ответ на: комментарий от dexpl 15.11.18 12:47:53 MSK

Зелёный на чёрном, наоборот, менее яркий для зрения вариант. Этот вариант предпочитают и те, у кого глаза слишком чувствительные, чтобы читать на мониторе чёрный текст на белом фоне (яркий белый фон бьёт таким людям по глазам).

saahriktu ★★★★★
(16.11.18 00:19:03 MSK) автор топика
Последнее исправление: saahriktu 16.11.18 00:19:22 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Deleted 15.11.18 11:52:59 MSK

Я, собственно, уже давно понял, что мои проекты полезны хорошо если нескольким десяткам людей. Однако, меня это ни разу не огорчало. В соответстии с логикой «если вкусы большинства не совпадают с моими, то это проблемы большинства».

saahriktu ★★★★★
(16.11.18 00:29:17 MSK) автор топика

Ссылка

Ответ на: комментарий от Deleted 14.11.18 18:45:22 MSK

Просто он нищий и ему не хватает на ещё один гигабайт (Это очень с избытком!) памяти.

Deleted
(16.11.18 10:31:41 MSK)

Ответ на: комментарий от Deleted 16.11.18 10:31:41 MSK

$ free -g
              total        used        free      shared  buff/cache   available
Mem:             15           0          14           0           0          14

Однобайтные кодировки просто удобнее. У них много плюсов, а у юникода много минусов. И количество байтов здесь ни при чём. Даже если бы это были не однобайтные кодировки, а, например, тридцатидвухбайтные кодировки, то они бы были всё равно удобнее юникода.

Есть, конечно, например, UTF-32, который устраняет один из серьёзных минусов UTF-8 - разный вес в байтах разных codepoint'ов. Однако, другой значительный минус юникода - модификаторы - есть и в нём. Из за модификаторов тексты для 100% поддержки юникода нужно предварительно разбирать чтобы понять из каких codepoint'ов что на какие знакоместа складывается.

Гораздо удобнее когда можно просто отсчитать заранее определённое количество байтов (пусть и значительно больше чем 1) чтобы перейти к следующему символу у которого тоже фиксированный вес в байтах.

Да и даже локали UTF-32, к сожалению, пока ещё нет.

saahriktu ★★★★★
(16.11.18 10:49:37 MSK) автор топика
Последнее исправление: saahriktu 16.11.18 10:50:51 MSK (всего исправлений: 2)

Несмотря на то, что saahriktu для меня выглядит довольно странным, используя KOI8-R, gopher, и так далее, именно то, что это возможно — является той красотой мира GNU/Linux, которую мы постепенно теряем.

Красотой возможностей выбора для каждого.

Deleted
(16.11.18 10:54:02 MSK)

Ссылка

Ответ на: комментарий от saahriktu 16.11.18 10:49:37 MSK

Гораздо удобнее когда можно просто отсчитать заранее определённое количество байтов (пусть и значительно больше чем 1) чтобы перейти к следующему символу у которого тоже фиксированный вес в байтах.

Гораздо удобнее не париться о таких вещах вообще. И пользоваться тем, что является стандартом по-сути.

qaqa ★★
(16.11.18 11:59:14 MSK)

Ответ на: комментарий от qaqa 16.11.18 11:59:14 MSK

Что значит «И пользоваться тем, что является стандартом по-сути.» в контексте побайтного низкоуровневого разбора текста?

Вот читаем по одному байту и собираем из прочитанного символы/кодепоинты.

Что в этом контексте удобнее? KOI8-R, UTF-8 или UTF-32?

Чтение текста в KOI8-R как раз и входит в дефолтный стандарт и осуществляется через побайтное чтение. Один байт - один символ. И наоборот.

С UTF-32 чуть сложнее:

        // BE/LE mode guess
        if (MODE_BELEG) {
                rcharrb = 0;
                for (rcptr = 0; rcptr < 4; rcptr++) {
                        if ((rcbuf = getchar()) == EOF) {
                                printf("Error: broken stream\n");
                                return 1;
                        }
                        rcharrb += (1 << 8 * rcptr) * rcbuf;
                }
                if (rcharrb == 4294836224) {
                        MODE_BE = 1;
                        printf("[UTF-32BE]");
                } else {
                        MODE_BE = 0;
                        printf("[UTF-32LE]");
                }
...
        }
        // stream process
        rcptr = -1;
        while ((rcbuf = getchar()) != EOF) {
                rcptr++;
                if (rcptr == 0)
                        rcharrb = 0;
                if (MODE_BE == 0)
                        rcharrb += (1 << 8 * rcptr) * rcbuf;
                else
                        rcharrb += (16777216 >> 8 * rcptr) * rcbuf;
                if (rcptr == 3) {
                        rcptr = -1;     // Reset pointer
...
                }
        }

А с UTF-8?

int sizeoffatc(int headbyte)
{
    if (headbyte >= 0 && headbyte <= 0x7f)
        return 1;
    else if (headbyte >= 0xc0 && headbyte <= 0xdf)
        return 2;
    else if (headbyte >= 0xe0 && headbyte <= 0xef)
        return 3;
    else if (headbyte >= 0xf0 && headbyte <= 0xf7)
        return 4;
    else if (headbyte >= 0xf8 && headbyte <= 0xff)
        return -1;              // error
    return -1;                  // error
}
...
int decodefatc(int fcdt0, int fcdt1, int fcdt2, int fcdt3, int fcmaxk)
{
    if (fcmaxk == 1)
        return (fcdt0 & 0x3f) << 0x6 | (fcdt1 & 0x7f);
    if (fcmaxk == 2)
        return (fcdt0 & 0xe0) << 0xc | (fcdt1 & 0x7f) << 0x6 | (fcdt2 &
                                                                  0x7f);
    return ((fcdt0 & 0xf0) << 0x12) | (((fcdt1 & 0x7f) << 0xc) +
        ((fcdt2 & 0x7f) << 0x6)) | (fcdt3 & 0x7f);
}

int fgetfatc(FILE * fatstream)
{
    int cdbuf, cdt[4];
    int cdindx = 0, maxk;
    for (;;) {
        cdbuf = fgetc(fatstream);
        if (cdindx == 0) {
            if (cdbuf == -1)
                return EOF;
            if (cdbuf < 0x80)
                return cdbuf;   // ASCII
            else
                maxk = sizeoffatc(cdbuf) - 1;
            if (maxk == -2)
                return -2;
        }
        cdt[cdindx] = cdbuf;
        cdindx++;
        if (cdindx > maxk)
            break;
    }
    return decodefatc(cdt[0], cdt[1], cdt[2], cdt[3], maxk);
}

saahriktu ★★★★★
(16.11.18 12:16:53 MSK) автор топика
Последнее исправление: saahriktu 16.11.18 12:20:41 MSK (всего исправлений: 1)

Ответ на: комментарий от saahriktu 16.11.18 12:16:53 MSK

в контексте побайтного низкоуровневого разбора текста

В контексте побайтового разбора, оно может и уместно. И только.

qaqa ★★
(16.11.18 14:27:35 MSK)

Ссылка

Ответ на: комментарий от saahriktu 15.11.18 11:02:17 MSK

С другой стороны это всё как-то ресурсозатратно, да (речь о человекоресурсе; кол-во ручной работы от всех этих юникодов и графических сред в целом резко увеличивается).

saahriktu ★★★★★
(16.11.18 21:13:54 MSK) автор топика
Последнее исправление: saahriktu 16.11.18 21:14:24 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от saahriktu 16.11.18 10:49:37 MSK

Плюсы UTF-8: поддержка большинства языков и не только; Поддержка большинством современного софта как дефолта из коробки; Лолиссимо: из-за мейнстримности - наличие тонны библиотек, которые скрывают повседневную рутину взаимодействия со строками напрямую, в Rust вшит намертво, попоболи я не ощутил.
Плюсы KOI8-R: экономия на спичках и получение N-ого символа за O(1).

Deleted
(16.11.18 23:34:05 MSK)