LINUX.ORG.RU

n7t328IIpnwd 0.3

 , ,


3

4

Состоялся релиз n7t328IIpnwd 0.3 — утилиты для lossless дампа UTF-32 данных в KOI8-R/ASCII.

Название утилиты является производным от «utf-32 to koi8-r dump», где «n7t» и «pnwd» являются зеркальными отражениями (по вертикали) «utf» и «dump» соответственно. Утилита является более мощным и более современным аналогом таких утилит, как utfinfo.pl и uniname из набора утилит uniutils. В число особенностей утилиты входят отключаемость режима «один символ на строку» (по умолчанию выключен), который является единственным рабочим режимом для перечисленных утилит, а также наличие обёртки KOI8-R, которая позволяет дампить символы из состава 2-й половины кодовой таблицы KOI8-R как они есть, в соответствующих кодах KOI8-R (по умолчанию включена). При отключении обёртки KOI8-R как они есть дампятся только символы из состава ASCII.

Для получения информации о названиях символов Юникода утилита использует библиотеку libunistring, которая является чуть ли не единственным современным решением. utfinfo.pl использует модуль CharName.pm из состава Unicode-String, который не содержит информацию о ряде новых символов из состава юникода, соответствует данным о стандарте не новее чем 2005 г. uniname использует собственную таблицу и не обновлялась с 2009 г.

Примеры результатов:

   В своей формулировке теоремы о неполноте Гёдель использовал понятие
   [GREEK SMALL LETTER OMEGA]-непротиворечивой формальной системы [EM DASH] более сильное условие, чем
   просто непротиворечивость. Формальная система называется
   [GREEK SMALL LETTER OMEGA]-непротиворечивой, если для всякой формулы A(x) этой системы
   невозможно одновременно вывести формулы А(0), А(1), А(2), [HORIZONTAL ELLIPSIS] и [THERE EXISTS]x [NOT SIGN]A(x)
   (другими словами, из того, что для каждого натурального числа n
   выводима формула A(n), следует невыводимость формулы [THERE EXISTS]x [NOT SIGN]A(x)). Легко
   показать, что [GREEK SMALL LETTER OMEGA]-непротиворечивость влечёт простую непротиворечивость
   (то есть, любая [GREEK SMALL LETTER OMEGA]-непротиворечивая формальная система
   непротиворечива)^[6].
Vine Linux [HIRAGANA LETTER NI][HIRAGANA LETTER TU][HIRAGANA LETTER I][HIRAGANA LETTER TE]

   Vine Linux [HIRAGANA LETTER HA][IDEOGRAPHIC COMMA]Project Vine[HIRAGANA LETTER O][HIRAGANA LETTER YO][HIRAGANA LETTER BI][591a][HIRAGANA LETTER KU][HIRAGANA LETTER NO][5354][529b][8005][HIRAGANA LETTER NI][HIRAGANA LETTER YO][HIRAGANA LETTER SMALL TU][HIRAGANA LETTER TE][958b][767a][HIRAGANA LETTER GA][884c][HIRAGANA LETTER WA][HIRAGANA LETTER RE][HIRAGANA LETTER TE][HIRAGANA LETTER I][HIRAGANA LETTER RU][IDEOGRAPHIC COMMA]
   [KATAKANA LETTER KO][KATAKANA LETTER N][KATAKANA LETTER PA][KATAKANA LETTER KU][KATAKANA LETTER TO][HIRAGANA LETTER DE][8efd][91cf][HIRAGANA LETTER NA][65e5][672c][8a9e]Linux[KATAKANA LETTER DE][KATAKANA LETTER SMALL I][KATAKANA LETTER SU][KATAKANA LETTER TO][KATAKANA LETTER RI][KATAKANA LETTER BI][KATAKANA LETTER SMALL YU][KATAKANA-HIRAGANA PROLONGED SOUND MARK][KATAKANA LETTER SI][KATAKANA LETTER SMALL YO][KATAKANA LETTER N][HIRAGANA LETTER DE][HIRAGANA LETTER SU][IDEOGRAPHIC FULL STOP] [KATAKANA LETTER I][KATAKANA LETTER N][KATAKANA LETTER SU][KATAKANA LETTER TO][KATAKANA-HIRAGANA PROLONGED SOUND MARK][KATAKANA LETTER RU][HIRAGANA LETTER NO][76f4][5f8c][HIRAGANA LETTER KA][HIRAGANA LETTER RA][5feb][9069][HIRAGANA LETTER NA][65e5][672c][8a9e][74b0][5883][HIRAGANA LETTER DE][4f5c][696d][HIRAGANA LETTER GA][HIRAGANA LETTER DE][HIRAGANA LETTER KI][HIRAGANA LETTER RU][HIRAGANA LETTER YO][HIRAGANA LETTER U][HIRAGANA LETTER NI][IDEOGRAPHIC COMMA]

В состав архива входит также скрипт n7t328IIpnwd_lynx.sh, который дампит текст со страницы по ссылке в KOI8-R (UTF-8 -> UTF-32 -> KOI8-R) через lynx.

>>> Скачать (2257 байт)

★★★★★

Проверено: Shaman007 ()

Неужели ты думаешь, что это хоть кому-то нужно, кроме тебя?

n7t328IIpnwd

Идеальное название утилиты для работы с кодировками.

sudopacman ★★★★★ ()

но название подобрали ужасно

Reedych ★☆ ()

n7t328IIpnwd

Мда... Зато гуглится Даже не гуглится...

Falcon-peregrinus ★★★★★ ()

Вангую что там троян. pnwd как бы толсто намекает

meequz ★★ ()
Ответ на: комментарий от meequz

Там исходник на Си. Можно посмотреть и убедиться, что там нет трояна. А «pnwd», как написано выше, - зеркальное отражение «dump».

saahriktu ★★★★★ ()
Ответ на: комментарий от saahriktu

А «pnwd», как написано выше, - зеркальное отражение «dump».

Зеркальное отражение dump будет qnwb, а не pnwd. Или ты в какую плоскость отражаешь?

Aceler ★★★★★ ()

Странное чувство, когда программа короче новости, в которой про нее говорится.

Shaman007 ★★★★★ ()

Угадай автора, что называется. Не нужно.

GblGbl ★★★★★ ()
Ответ на: комментарий от Aceler

А, ну да, ошибся. Ну, если первую и последнюю буквы ещё раз отзеркалить в другой плоскости, то это оно и будет.

saahriktu ★★★★★ ()

Угадал автора новости по заголовку.
Я так понимаю, Эдик сегодня на радостях забухает?

sluggard ★★★★★ ()

pnwd

Ловите его, он таки тролль!

EXL ★★★★★ ()

Название утилиты является производным от «utf-32 to koi8-r dump», где «n7t» и «pnwd» являются зеркальными отражениями (по вертикали) «utf» и «dump» соответственно.

Я бы еще добавил остатки от деления и битовые сдвиги, иначе слишком очевидное и банальное название.

DELIRIUM ☆☆☆☆☆ ()

Интересно, кому и для чего это могло бы понадобиться?

dexpl ★★★★★ ()

Открытие месяца поделок на ЛОРе.

Ну ничего, держись ЛОР, скоро полезут Web-приложения.

bookman900 ★★★★★ ()
Ответ на: комментарий от dexpl

Как минимум, юзерам текстовых терминалов с локалью KOI8-R для большей сохранности данных из юникодных текстов, а также тем, кто разбирает юникодные строки для своих целей.

saahriktu ★★★★★ ()
Ответ на: комментарий от saahriktu

Как минимум, юзерам текстовых терминалов с локалью KOI8-R

Целых 1.5 человека ? Не нужно (с)

joy4eg ★★★★★ ()
Ответ на: комментарий от joy4eg

У Линуса Торвальдса другой подход. Он, вон, один из старых драйверов не выпилил потому, что нашёлся один (всего один!) человек, которому это оказалось нужно.

saahriktu ★★★★★ ()
Ответ на: комментарий от DELIRIUM

subj: not sure if trolling...

Соль нужно добавить в название, так ещё вкуснее будет )

darkduke ()

Палата мер и весов уже инициировала процесс замены предыдущего эталона «ненужно»?

queen3 ★★★★★ ()
Ответ на: комментарий от saahriktu

юзерам текстовых терминалов с локалью KOI8-R

Что, всем трём с половиной ретроградам?

anonymous ()

а можно ещё такое же, но чтобы картинки словами описывало? (8

в линксе очень пригодится.

lazyest ()

Улыбнулся от заголовка, рассмеялся в голос от истории названия, но не такая уж и бесполезная штука, на самом деле, вышла.

mix_mix ★★★★★ ()

а чем это распаковывать?

Harald ★★★★★ ()
Ответ на: комментарий от sudopacman

Неужели ты думаешь, что это хоть кому-то нужно, кроме тебя?

Неистово лорчую.

anonymous ()
Ответ на: комментарий от saahriktu

юзерам текстовых терминалов с локалью KOI8-R

То есть никому, кроме тебя.

тем, кто разбирает юникодные строки для своих целей

Что за цели должны преследовать те, кому нужны строки вида "Vine Linux [HIRAGANA LETTER NI][HIRAGANA LETTER TU][HIRAGANA LETTER I][HIRAGANA LETTER TE]"?

dexpl ★★★★★ ()
Последнее исправление: dexpl (всего исправлений: 1)
Ответ на: комментарий от dexpl

Что за цели должны преследовать те, кому нужны строки вида

Примерно такие же как у тех людей, которые ищут/пишут utfinfo.pl и uniname, а также создают вот такие темы: http://superuser.com/questions/581523/program-to-check-look-up-utf-8-unicode-... .

saahriktu ★★★★★ ()
Последнее исправление: saahriktu (всего исправлений: 1)
Ответ на: комментарий от Harald

Пожато стандартным lzip'ом (им многие официальные тарболы проекта GNU пожаты, в т.ч. и без альтернатив). Распаковать можно стандартным lunzip'ом. Последние версии tar'а знают его из коробки, и всё корректно распакуют по команде «tar xvf n7t328IIpnwd-0.3.tar.lz».

saahriktu ★★★★★ ()

Где ссылка на dvcs-репозиторий?

KOI8-R

А, всё понятно.

как они есть дампятся только символы из состава ASCII.

А заэскейпить '[' не забыли? Иными словами: во что превращается текст при вторичной конвертации?

anonymous ()
Ответ на: комментарий от dexpl

Что за цели должны преследовать те, кому нужны строки вида «Vine Linux [HIRAGANA LETTER NI][HIRAGANA LETTER TU][HIRAGANA LETTER I][HIRAGANA LETTER TE]»

Vine Linux について лучше? :-)

Aceler ★★★★★ ()
Ответ на: комментарий от anonymous

Нет там никакой конвертации. Просто одни символы выводятся как они есть, а другие названиями в квадратных скобках. Если важно распарсить посимвольно, то можно включить режим «один символ на строку».

saahriktu ★★★★★ ()
Ответ на: комментарий от saahriktu

Разобрался, но я почему-то первый раз с таким форматом сталкиваюсь

Harald ★★★★★ ()
Ответ на: комментарий от Harald

А я lzip уже несколько лет знаю. С тех пор как им стали жать исходники ed'а.

saahriktu ★★★★★ ()

ящитаю, проекту остро не хватает системы сборки на Autotools, man-страниц, info-файла, скриптов для сборки .deb, .rpm и .ebuild пакетов!

Harald ★★★★★ ()
Ответ на: комментарий от saahriktu

KDE-шный Ark у меня его не признаёт за архив

Harald ★★★★★ ()
Ответ на: комментарий от buratino

шифровку принял

Ты, походу, что-то другое принял, Алекс.

Yustas ★★★★ ()
Ответ на: комментарий от Yustas

у него есть ключ

а у тебя ключа нету

и вообще, ты не Юстас, а Ева или Мэллори :)

Harald ★★★★★ ()
Ответ на: комментарий от saahriktu

Аноним спрашивает, является ли преобразование однозначно обратимым, как можно предположить по подстроке «lossless» в описании программы. Но что-то подстрока «[6]» в первом примере мне подсказывает, что нет.

Centaur ()

[EM DASH]😈

😛👀

EM😔🎮🎬🎩👢

😨🍃🌭
Он всё видит! 😶🌒🎑

mos ★★☆☆☆ ()
Ответ на: комментарий от Centaur

Так всё зависит от режима. Если режим «один символ на строку» был выключен, то результат, конечно, необратим, и предназначен просто для чтения. А вот если нужно внимательнее разбирать строки, то, повторяю, можно включить тот режим, и тогда на каждой строке будет только то, что относится к отдельному символу. И это уже обратимо. Т.е. станет очевидна разница между

[EM DASH][EM DASH]
и
[
E
M

D
A
S
H
]
[EM DASH]

saahriktu ★★★★★ ()
Ответ на: комментарий от Aceler

Конечно, лучше. Хотя бы понятно, что написано «про Vine Linux».

Если ставить целью читать это на терминалах западных варваров, то конвертировать надо в «ni tsuite», можно с какими-нибудь тэгами, кодирующими, что это всё хирагана.

Впрочем, без таблицы символов понять, что такое «Project Vine oyobi [591a]ku no [5354][529b][8005]ni yotte», всё равно невозможно.

Centaur ()

KOI8-R консоль
tar xvf
ed

Кажется, я всё понял.

anonymous ()

[6]

Не эскейпится → дамп с потерями, если в оригинале были [ПОДОБНЫЕ ВЕЩИ], то ты не сможешь восстановить оригинал без потерь.

[591a][HIRAGANA LETTER KU][HIRAGANA LETTER NO]

多くの банально читаемее, может, осилишь фреймбуфер? Даже bsd-юзеры осилили.

x3al ★★★★★ ()
Ответ на: комментарий от x3al

Выше уже написал, что у этого режима нет такой задачи, но есть другой режим с возможностью обратимости.

Фреймбуфер и KOI8-R друг другу не противоречат, поскольку можно гонять текстовую ядерную консоль поверх фреймбуфера, а юникод целиком и полностью в неё не влазит.

saahriktu ★★★★★ ()
Последнее исправление: saahriktu (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.