LINUX.ORG.RU

n7t328IIpnwd 0.3

 , ,


3

4

Состоялся релиз n7t328IIpnwd 0.3 — утилиты для lossless дампа UTF-32 данных в KOI8-R/ASCII.

Название утилиты является производным от «utf-32 to koi8-r dump», где «n7t» и «pnwd» являются зеркальными отражениями (по вертикали) «utf» и «dump» соответственно. Утилита является более мощным и более современным аналогом таких утилит, как utfinfo.pl и uniname из набора утилит uniutils. В число особенностей утилиты входят отключаемость режима «один символ на строку» (по умолчанию выключен), который является единственным рабочим режимом для перечисленных утилит, а также наличие обёртки KOI8-R, которая позволяет дампить символы из состава 2-й половины кодовой таблицы KOI8-R как они есть, в соответствующих кодах KOI8-R (по умолчанию включена). При отключении обёртки KOI8-R как они есть дампятся только символы из состава ASCII.

Для получения информации о названиях символов Юникода утилита использует библиотеку libunistring, которая является чуть ли не единственным современным решением. utfinfo.pl использует модуль CharName.pm из состава Unicode-String, который не содержит информацию о ряде новых символов из состава юникода, соответствует данным о стандарте не новее чем 2005 г. uniname использует собственную таблицу и не обновлялась с 2009 г.

Примеры результатов:

   В своей формулировке теоремы о неполноте Гёдель использовал понятие
   [GREEK SMALL LETTER OMEGA]-непротиворечивой формальной системы [EM DASH] более сильное условие, чем
   просто непротиворечивость. Формальная система называется
   [GREEK SMALL LETTER OMEGA]-непротиворечивой, если для всякой формулы A(x) этой системы
   невозможно одновременно вывести формулы А(0), А(1), А(2), [HORIZONTAL ELLIPSIS] и [THERE EXISTS]x [NOT SIGN]A(x)
   (другими словами, из того, что для каждого натурального числа n
   выводима формула A(n), следует невыводимость формулы [THERE EXISTS]x [NOT SIGN]A(x)). Легко
   показать, что [GREEK SMALL LETTER OMEGA]-непротиворечивость влечёт простую непротиворечивость
   (то есть, любая [GREEK SMALL LETTER OMEGA]-непротиворечивая формальная система
   непротиворечива)^[6].
Vine Linux [HIRAGANA LETTER NI][HIRAGANA LETTER TU][HIRAGANA LETTER I][HIRAGANA LETTER TE]

   Vine Linux [HIRAGANA LETTER HA][IDEOGRAPHIC COMMA]Project Vine[HIRAGANA LETTER O][HIRAGANA LETTER YO][HIRAGANA LETTER BI][591a][HIRAGANA LETTER KU][HIRAGANA LETTER NO][5354][529b][8005][HIRAGANA LETTER NI][HIRAGANA LETTER YO][HIRAGANA LETTER SMALL TU][HIRAGANA LETTER TE][958b][767a][HIRAGANA LETTER GA][884c][HIRAGANA LETTER WA][HIRAGANA LETTER RE][HIRAGANA LETTER TE][HIRAGANA LETTER I][HIRAGANA LETTER RU][IDEOGRAPHIC COMMA]
   [KATAKANA LETTER KO][KATAKANA LETTER N][KATAKANA LETTER PA][KATAKANA LETTER KU][KATAKANA LETTER TO][HIRAGANA LETTER DE][8efd][91cf][HIRAGANA LETTER NA][65e5][672c][8a9e]Linux[KATAKANA LETTER DE][KATAKANA LETTER SMALL I][KATAKANA LETTER SU][KATAKANA LETTER TO][KATAKANA LETTER RI][KATAKANA LETTER BI][KATAKANA LETTER SMALL YU][KATAKANA-HIRAGANA PROLONGED SOUND MARK][KATAKANA LETTER SI][KATAKANA LETTER SMALL YO][KATAKANA LETTER N][HIRAGANA LETTER DE][HIRAGANA LETTER SU][IDEOGRAPHIC FULL STOP] [KATAKANA LETTER I][KATAKANA LETTER N][KATAKANA LETTER SU][KATAKANA LETTER TO][KATAKANA-HIRAGANA PROLONGED SOUND MARK][KATAKANA LETTER RU][HIRAGANA LETTER NO][76f4][5f8c][HIRAGANA LETTER KA][HIRAGANA LETTER RA][5feb][9069][HIRAGANA LETTER NA][65e5][672c][8a9e][74b0][5883][HIRAGANA LETTER DE][4f5c][696d][HIRAGANA LETTER GA][HIRAGANA LETTER DE][HIRAGANA LETTER KI][HIRAGANA LETTER RU][HIRAGANA LETTER YO][HIRAGANA LETTER U][HIRAGANA LETTER NI][IDEOGRAPHIC COMMA]

В состав архива входит также скрипт n7t328IIpnwd_lynx.sh, который дампит текст со страницы по ссылке в KOI8-R (UTF-8 -> UTF-32 -> KOI8-R) через lynx.

>>> Скачать (2257 байт)

★★★★★

Проверено: Shaman007 ()
Последнее исправление: sudopacman (всего исправлений: 3)

Ответ на: комментарий от sudopacman

Нет, не каждого. Вот поэтому софтина и использует таблицу имён юникодных символов - из библиотеки libunistring. Кодами отображаются только те символы, названий которых нет в таблице библиотеки. А у этой библиотеки она одна из наиболее полных.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от Centaur

Ну так какая разница-то, какую подстроку не мочь прочитать — <<>>, <<[591a]>>, <<>> или <<?>>?

Так хотя-бы код символа видно. Утилита-то именно для lossless дампа. А с потерями, конечно, можно конвертнуть в "".

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от Centaur

Если ставить целью читать это на терминалах западных варваров

У западных варваров будет ещё понятнее: Vine Linux ????

Aceler ★★★★★
()

Лоровцы как бабки с семками, любят налететь стаей и покукарекать про ненужное ненужно, самоутвердиться в каментах и с довольной душонкой покинуть тред.

anonymous
()
Ответ на: комментарий от dexpl

Скорость? Это дело очень быстро работает, при небольшой затрате ресурсов.

anonymous
()
Ответ на: комментарий от joy4eg

Фашисты не признают альтернативных точек зрения и прав любых меньшинств.

Sociopsih ★☆
()

Анонимус одобряет

А можешь запилить на базе этого облачный сервис с JSON-API? Цены не будет.

anonymous
()
Ответ на: комментарий от queen3

Конечно LibreBSD (или как её там) уже ненужно как эталон ненужно.

awesomebuntu
()

Угадал автора по теме, поздравляю!

ViTeX ★★★★
()
Ответ на: Анонимус одобряет от anonymous

А можешь запилить на базе этого облачный сервис с JSON-API?

Не могу.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от vedro
   Недавно разработчикам ядра Linux поступило предложение удалить из ядра поддержку шины EISA, которая была мало
   распространена более 20-ти лет назад, и в более позднем железе практически не встречается. В ходе дискуссии по
   поводу Линус Торвальдс озвучил политику по поводу поддержки технологий в ядре.

   Поскольку, нашёлся один пользователь сервера с шиной EISA, на котором работает актуальная версия ядра, Линус
   заявил, что пока какой-либо технологией пользуется хотя-бы один человек с актуальной версией ядра - поддержка
   этой технологии из ядра удаляться не будет. Исключение будет делаться лишь для тех технологий, которые
   присутствуют в ядре не обособленно, и препятствуют дальнейшему развитию ядра.

23 Январь 2015
saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

Поскольку, нашёлся один пользователь сервера с шиной EISA, на котором работает актуальная версия ядра

А 386DX-ом никто не пользовался? По-моему, его относительно недавно(меньше 10 лет назад) сняли с производства.

antoshka117
()
Ответ на: комментарий от antoshka117

Что касается i386, то тут сработало

Исключение будет делаться лишь для тех технологий, которые присутствуют в ядре не обособленно, и препятствуют дальнейшему развитию ядра.

Видимо, по началу там всё было настолько захардкожено, что потом по-человечески разделить уже не получилось, и решили вырезать совсем.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от Falcon-peregrinus

Уже гуглится этот тред и парочка дорвеев, которые, наверное, тырят отсюда

goingUp ★★★★★
()
Последнее исправление: goingUp (всего исправлений: 1)

Прорывная технология XXI века. Теперь заживём!

А название...вообще, умммм...конфетка.

PS: Может, мне тоже «новости» про свои микроутилитки запузонивать? По принципу «мал клоп, да вонюч».

DeVliegendeHollander ★★
()
Ответ на: комментарий от anonymous

Нет, серверами с шиной EISA не пользуюсь.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от dexpl

Вы просто не привыкли работать в командной строке. После ядерной консоли иксы поражают тормозами (точнее, тормозит софт под иксы; а другого нет; самому столько писать - не вариант; чтобы оно летало тут надо писать чуть-ли не на ассемблере, а если писать так, чтобы хватило человеческих жизней, то тут только высокоуровневые языки остаются с аналогичным результатом) и отсутствием возможности что-либо сделать нормально вне эмулятора терминала. Хотя, конечно, если у юзера есть задачи по работе с графикой и форматированными документами, то ему от иксов никуда не деться, и привыкнуть к командной строке просто не получится за отсутствием этого опыта.

saahriktu ★★★★★
() автор топика
Последнее исправление: saahriktu (всего исправлений: 2)
Ответ на: комментарий от alwayslate

Чего там конфигурировать-то? Всё собирается так:

gcc -o n7t328IIpnwd n7t328IIpnwd.c -lunistring
Вместо man'а там Readme и встроенный help ("-h").

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

слушай, впилить автотулз дело 3х минут, это удобно и стандартно.

ман впрочем тоже тк привычно набрать man. ну и long options тоже не плохо б иметь.

про ненужность я не говорю, тк кому то нужно, но удобно было б автотулз, маны и long options тк привычно.

alwayslate ★★
()

n7t328IIpnwd

Ух-жишь-ё...

ashot ★★★★
()
Ответ на: комментарий от alwayslate

autotools применяются для сложных проектов с модульной структурой. Ещё можно понять необходимость ./configure и прочего когда нужно проверять какие библиотеки есть в системе и какие опции у компилятора и glibc чтобы в соответствии с этим включить/отключить модули и другие опции сборки. А когда ничего не меняется, то одного Makefile выше крыши.

Опций там тоже не десятки, а всего 3:

Options:
-a - off KOI8-R wrapper (ASCII only)
-1 - one char per line mode
-h - help
Ну и зачем ради этого создавать man page?

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от alwayslate

Это там тоже есть. По команде «make install» бинарник скопируется в /usr/bin. По команде «make install-scripts» туда же скопируется и скрипт. Вот и всё. При желании копировать не в /usr/bin можно подредактировать пути в Makefile. И никакие интеграции тут не нужны. После установки софтину можно использовать в любых командных конструкциях, перенаправлять в неё текст в UTF-32 откуда угодно, и перенаправлять вывод из неё куда угодно.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от saahriktu

зависимость от libunistring же есть, надо её наличие проверить, как минимум

а вдруг кто-то захочет кросскомпилировать твою программу

Harald ★★★★★
()
Ответ на: комментарий от Harald

Ну так без неё в любом случае не соберётся. В любом случае нужно сначала поставить эту библиотеку.

Тогда он сможет подредактировать Makefile.

saahriktu ★★★★★
() автор топика
Ответ на: комментарий от alwayslate

Вам бы лишь говнотулсы впиливать одинокими вечерами. Хуже опа думал не будет.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.