uutils 0.2.0 и 0.2.2, вариант GNU Coreutils на языке Rust

2

6

6 сентября опубликован выпуск 0.2.0 проекта uutils coreutils (Rust Coreutils), развивающего аналог пакета GNU Coreutils, написанный на языке Rust. В состав coreutils входит более ста утилит, включая sort, cat, chmod, chown, chroot, cp, date, dd, echo, hostname, id, ln и ls. Целью проекта является создание кроссплатформенной альтернативной реализации Coreutils, среди прочего способной работать на платформах Windows, Redox и Fuchsia.

Rust Coreutils применяется в дистрибутивах AerynOS (Serpent OS) и Apertis, а также будет задействован по умолчанию в осеннем выпуске Ubuntu 25.10. В отличие от GNU Coreutils реализация на Rust распространяется под пермиссивной лицензией MIT, вместо копилефт-лицензии GPL. Дополнительно той же командой разработчиков развиваются написанные на Rust аналоги наборов утилит util-linux, diffutils, findutils и procps, а также программ sed и login.

В новой версии Rust Coreutils:

Пакет признан полностью готовым для рабочего применения в Ubuntu. Устранены все проблемы, мешавшие переходу Ubuntu по умолчанию на Rust Coreutils.
Добавлена поддержка локализации и интернационализации. Введена в строй инфрастурктура для поддержания переводов сообщений на разные языки. Учтены параметры локали при форматировании вывода и начат перевод на разные языки сообщений об ошибках. Для поддержки многоязычности задействована система локализации Fluent, развиваемая Mozilla и используемая в Firefox.
Добавлена поддержка Unicode. Символы Unicode, в том числе emoji, теперь могут применяться при обработке содержимого и параметров, например, в качестве разделителей полей: echo "🍔🍟🥤" | cut -d"🍟" -f1.
Проведена оптимизация производительности утилит tr, sort и cat. Производительность утилиты tr повышена в 15 раз - ранее данная утилита была медленнее GNU tr в 9.8 раз, а теперь быстрее в 1.58 раза.
Улучшена совместимость с эталонным тестовым набором GNU Coreutils, при прохождении которого успешно выполнено 538 тестов (в прошлой версии 522), 52 (65) теста завершилось неудачей, а 27 (31) тест был пропущен.
Улучшена совместимость с GNU Coreutils для утилит date, du, fmt, ls и sort.
Расширены возможности, устранены проблемы и добавлены недостающие опции для утилит basenc, basename, cat, chmod, chown, cksum, cp, split, date, dd, du, echo, env, expr, factor, fold, hashsum, head, install, ln, logname, ls, mkdir, mkfifo, mktemp, more, mv, nice, nl, od, pr, printf, pwd, realpath, rm, shred, sort, stat, stdbuf, stty, sync, tail, tee, timeout, touch, tr, uname, unexpand, uptime, users и who.

Версия 0.2.2 содержит исправления критических ошибок. Эти исправления обеспечивают безопасное распространение и развёртывание на разных платформах. Разработчики также улучшили производительность base64, сделав её в 1.56 раза быстрее, чем в версии GNU.

>>> Подробности на opennet

Ссылка

←	SRELL 4.069 — библиотека ECMAScript-совместимых регулярных выражений

VirtualBox 7.2.2

→

← 1 2 3 4 →

Ответ на: комментарий от tiinn 12.09.25 17:36:44 MSK

Очень странный комментарий. Люди переписывают критически важный код с питона на си совершенно не для того, чтобы упростить дальнейшую поддержку. Это, наоборот, ухудшает дальнейшую поддержку - почему, разговор отдельный.

Люди переписывают код с питона на си только и исключительно для того, чтобы улучшить скорость работы и распределение ресурсов. То есть прямо противоположно тому, о чем вы говорите.

VIT ★★
(12.09.25 19:11:05 MSK)

Ответ на: комментарий от rumgot 12.09.25 18:04:19 MSK

Если бы все было так просто! Проблемы производительности безусловно связаны с алгоритмом, но дополнительно к самому алгоритму, важным является и реализация алгоритма, и условия выполнения программы, и возможности железа, и вообще много чего. Первая задача специалиста по производительности - определить, что именно является причиной ограничения ожидаемой производительности. А для этого надо хотя бы иметь представление, а что ожидается увидеть. Так что все не так просто, как хотелось бы.

VIT ★★
(12.09.25 19:16:41 MSK)

Ответ на: комментарий от VIT 12.09.25 19:11:05 MSK

Мы же, вроде, переписывание с С на раст обсуждаем

tiinn ★★★★★
(12.09.25 19:36:28 MSK)

Ответ на: комментарий от UriZzz 12.09.25 11:05:28 MSK

Почему не GPL?

Им было лень его прочитать.

PunkPerson ★
(12.09.25 19:41:59 MSK) автор топика

Ссылка

Coreutils, переписанные на Rust внедряют в Ubuntu…

Ждём, когда Линуса торкнет…

PunkPerson ★
(12.09.25 19:42:56 MSK) автор топика

Ссылка

Ответ на: комментарий от VIT 12.09.25 19:16:41 MSK

Если бы все было так просто

Ты это «просто» сам увидел и героически опроверг. Разумеется все сравнения проводят на одном и том же железе в одной операционке, чередуя вызовы разных тестов. Если это не очевидно, то мои поздравления, продолжай бороться с мельницами.

rumgot ★★★★★
(12.09.25 20:40:32 MSK)

Ответ на: комментарий от sarumeister 12.09.25 18:21:42 MSK

Все ж у Zig проблемы в иной плоскости. Не в плоскости оптимизаций и быстроты.

Я не утверждал обратного. Ты сам с собой споришь? Моя мысль, если не получается понять: простое переписывание утилит с C на Rust/Zig ничего принципиально не поменяет в произвдительности. А утилиты из coreutils получили буст не от переписывания самого по себе, а от дополнительно проведенной оптимизации, которую можно было сделать и исхдным версиям на C.

Я хз, за каким бесом ты еще Zig преплел.

rumgot ★★★★★
(12.09.25 20:45:26 MSK)
Последнее исправление: rumgot 12.09.25 20:45:54 MSK (всего исправлений: 1)

Ответ на: комментарий от rumgot 12.09.25 20:40:32 MSK

И что? Продолжай улучшать алгоритм, если у тебя памяти не хватает, оптимизатор ты наш.

VIT ★★
(12.09.25 21:06:35 MSK)

Ответ на: комментарий от rumgot 12.09.25 20:45:26 MSK

Вообще неочевидно. В расте при небольших усилиях можно получить код, который легко векторизуется компилятором, и даже ансейфа не потребуется. В си семантика языка часто не даёт провести аналогичные оптимизации.

unC0Rr ★★★★★
(12.09.25 21:10:26 MSK)

Ответ на: комментарий от anc 12.09.25 12:25:35 MSK

Выше писали, что есть два варианта - либо один бинарь (по типу busybox), либо каждая тулза в своем бинарнике. Один бинарь компилить гораздо быстрее, поэтому я для тестов установил себе именно его.

provaton ★★★★★
(12.09.25 22:00:57 MSK)

Ссылка

Ответ на: комментарий от sena 12.09.25 12:29:51 MSK

умение загрузить ядра ЦПУ - это фича, а не баг. Программу, которая грузит все ядра, можно запинить на одно ядро, можно поставить найс, чтоб понизить приоритет в шедулинге. Вариантов куча. Но если программа не умеет эффективно юзать железо, то ты уже сторонними средствами ее никак не ускоришь.

provaton ★★★★★
(12.09.25 22:03:31 MSK)

Ответ на: комментарий от Dark_SavanT 12.09.25 18:17:15 MSK

Я заранил стандартный релиз билд, который там из коробки. Он динамически залинкован с глибц, так что статический musl тут никак не поможет. Можно было бы поиграться с флагами компилятора, но у меня есть более интересные варианты вечернего времяпровождения)

provaton ★★★★★
(12.09.25 22:06:30 MSK)

Ссылка

Ответ на: комментарий от VIT 12.09.25 21:06:35 MSK

Снисходительным тоном ты кажется себе более весомый видимо.

rumgot ★★★★★
(12.09.25 22:19:24 MSK)

Ответ на: комментарий от unC0Rr 12.09.25 21:10:26 MSK

Часто не даёт, а часто даёт. И в итоге нам показывают разницу в бенчмарках между языками в пределах 1% (при том, что в разных тестах разные языки лидируют), тогда как в теме упоминается разница в 15раз. Стопудово исключительно переход на раст повлиял, и больше ничего.

rumgot ★★★★★
(12.09.25 22:26:03 MSK)
Последнее исправление: rumgot 12.09.25 22:27:05 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от dunmaksim 12.09.25 12:46:57 MSK

С ним то все так, просто нытья-то сколько было?

Zlogene ★★
(12.09.25 22:35:00 MSK)

Ссылка

Ответ на: комментарий от rumgot 12.09.25 22:19:24 MSK

Я тебя призываю думать, а не просто печатать.

VIT ★★
(12.09.25 22:52:24 MSK)

Ответ на: комментарий от provaton 12.09.25 09:44:30 MSK

Это проблема

Это возможность... ;P

«Это не баг, это фича!» © :))))

Somebody ★★★★
(13.09.25 02:41:19 MSK)

Ссылка

Ответ на: комментарий от rumgot 12.09.25 20:45:26 MSK

простое переписывание утилит с C на Rust/Zig ничего принципиально не поменяет в произвдительности

Почему здесь раст и зиг через слэш? Переписывание на первый не будет быстрее кода на Си, пока не рассуешь unsafe тут и там. Второй сразу из коробки быстрее кода на Си (оптимизации llvm vs gcc; комптайм, статическая линковка, struct of arrays, хитрые аллокаторы).

Однако не советую бросаться переписывать утилиты с С на Zig, там буквально месяц назад опять все поломали в пользу бесцветного async.

sarumeister ★
(13.09.25 02:48:05 MSK)
Последнее исправление: sarumeister 13.09.25 03:00:18 MSK (всего исправлений: 2)

Ответ на: комментарий от tiinn 12.09.25 19:36:28 MSK

Повторяется история с Devuan: нитакуськи придумали сами себе проблем, не будем переходить на systemd, говорят, будем без него.

Была даже шутка что Devuan разрабатывают по методике BDD: Butthurt Driven Development.

Сейчас тут то же самое происходит: не будем с C на Rust переписывать, не будем уже переписанное использовать, сейчас мы вам покажем как на C безопасно писать.

пишет свой Hello World портит структуры ядра получает kernel panic

Зато не Rust, зато не Rust! Там unsafe! Там боровы! Там сложный синтаксис! А там! А там! А там! Нельзя указатели складывать, вычитать и умножать! Нет 254 функций копирования строки!

dunmaksim ★
(13.09.25 07:28:24 MSK)

Ссылка

Ответ на: комментарий от rumgot 12.09.25 14:41:19 MSK

Концептуально проблемы производительности софта при сравнении двух компилируемых языков возникают из-за неоптимальных алгоритмов.

Если бы было так, производительность софта на Си никак не зависела бы от версии и ключей компилятора, ведь один и тот же исходник очевидно реализует один и тот же алгоритм. Однако зависит, причём на порядки.

monk ★★★★★
(13.09.25 07:47:29 MSK)

Ответ на: комментарий от monk 13.09.25 07:47:29 MSK

Да нет там никаких порядков. 90% софта практически не зависит от ключей компилятора. И от версии не зависит.

tiinn ★★★★★
(13.09.25 08:05:55 MSK)

Ответ на: комментарий от tiinn 13.09.25 08:05:55 MSK

Предлагаешь компилировать всё с -O0? Надёжней ведь будет, а скорость, по-твоему, практически не изменится.

monk ★★★★★
(13.09.25 08:41:16 MSK)

Ответ на: комментарий от tiinn 13.09.25 08:05:55 MSK

Ладно, про порядки, согласен, преувеличение. Но в разы отклонение есть.

monk ★★★★★
(13.09.25 08:51:26 MSK)

Ответ на: комментарий от monk 13.09.25 08:51:26 MSK

В разы, это тоже как-то подозрительно. Чем такое объяснить? Векторизацией?

GAMer ★★★★★
(13.09.25 09:51:06 MSK)

Ответ на: комментарий от GAMer 13.09.25 09:51:06 MSK

Собери софт с -O0 и -O2 и посмотри, в чем разница машинного кода. Там как раз набегает «в разы».

А вообще в целом - тормозит не программа целиком, а несколько конкретных горячих точек. Для повышения скорости достаточно оптимизировать их. Холодные части ПО не оказывают заметного влияния на производительность.

wandrien ★★★
(13.09.25 09:55:51 MSK)

Ссылка

Ответ на: комментарий от monk 13.09.25 08:41:16 MSK

я вообще ключей не знаю, всё с дефолтом компилирую, меня всё устраивает.

tiinn ★★★★★
(13.09.25 11:49:08 MSK)

Ссылка

Ответ на: комментарий от tiinn 13.09.25 08:05:55 MSK

Вот хороший пример:

https://habr.com/ru/articles/647165/

Без изменения алгоритма, только изменяя типы переменных и положение функций в файлах, время выполнения снижается с 223 секунд до 7. Полтора порядка. И это сравнивается оптимизированная версия с оптимизированной.

monk ★★★★★
(13.09.25 11:51:57 MSK)

Ответ на: комментарий от monk 13.09.25 11:51:57 MSK

О, да, на специально подготовленных примерах это так и будет работать. А на 90% обычного ПО - нет.

tiinn ★★★★★
(13.09.25 11:52:52 MSK)

Ссылка

Ответ на: комментарий от VIT 12.09.25 22:52:24 MSK

Нет, ты пытаешься подчеркнуть некую свое превосходство используя снисхождение. Причём получается только в собственных глазах.

rumgot ★★★★★
(13.09.25 14:36:03 MSK)
Последнее исправление: rumgot 13.09.25 14:38:15 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от monk 13.09.25 07:47:29 MSK

Господи, я утомляюсь повторять uutils 0.2.0 и 0.2.2, вариант GNU Coreutils на языке Rust (комментарий)

rumgot ★★★★★
(13.09.25 14:37:57 MSK)

Ответ на: комментарий от GAMer 13.09.25 09:51:06 MSK

В разы, это тоже как-то подозрительно. Чем такое объяснить? Векторизацией?

Начиная с того, что при O0 каждое состояние памяти программы должно быть устойчиво и восстановимо. Это требование родилось, когда строилась формальная теория компиляции и к вопросам корректности относились с математической точки зрения. Во что выливается такой подход? Ну например в то, что когда ты пишешь

for ( int i=0; i>N; i++ )

переменная i хранится в памяти и каждый раз, когда ты к ней обращаешься - генерируется memory load, а при модификации - memory store. Оптимизирующий компилятор такие переменные обычно кладет в регистры. А ещё существуют архитектуры, например IBM Power, которые позволяют организовать цикл вообще без переменной.

Векторизация при формальной корректности вообще запрещена как неопределенная. Вот и считай эффект от оптимизации. В разы? Да в сотни раз легко. В разы я получаю ускорение простой правкой ассемблера исправляя косяки компилятора.

VIT ★★
(13.09.25 15:19:51 MSK)

Ссылка

Ответ на: комментарий от sarumeister 13.09.25 02:48:05 MSK

Просто перечитай вдумчиво uutils 0.2.0 и 0.2.2, вариант GNU Coreutils на языке Rust (комментарий)

rumgot ★★★★★
(13.09.25 15:20:11 MSK)

Ответ на: комментарий от rumgot 13.09.25 14:37:57 MSK

В 15 раз там между двумя растовыми версиями. Между Си и Растом в полтора.

monk ★★★★★
(13.09.25 15:42:46 MSK)

Ответ на: комментарий от rumgot 13.09.25 15:20:11 MSK

Просто перечитай вдумчиво

Бывает так, что человеку показываешь 50%, а он видит 1%. На ютубе синтетический тест deno vs. node.js vs. bun — как раз про 50%.

sarumeister ★
(13.09.25 16:23:31 MSK)

Ответ на: комментарий от sarumeister 13.09.25 16:23:31 MSK

Перечитай и озвучь тезис, с которым ты споришь. Серьёзно. Ты не понимаешь, с чем ты споришь.

rumgot ★★★★★
(13.09.25 16:42:04 MSK)

Ссылка

Ответ на: комментарий от monk 13.09.25 15:42:46 MSK

Ну и в чем я не прав? Переписали в лоб - херня. Занялись оптимизацией - буст x15.

rumgot ★★★★★
(13.09.25 16:44:15 MSK)

Ответ на: комментарий от rumgot 13.09.25 16:44:15 MSK

Занялись оптимизацией - буст x15.

Но согласись, код на Си оч не оч. Иногда хочется простых обычных ссылок вместо указателей.

sarumeister ★
(13.09.25 17:58:26 MSK)

Ответ на: комментарий от sarumeister 13.09.25 17:58:26 MSK

Разумеется да. Но меня коробит, что постоянно выходят очередные убийцы и что-то начинают на них переписывать. При этом новые языки решают какие-то проблемы, а какие-то привносят. А разработчики теперь при желании сменить работу вынуждены прыгать с языка на язык. Или знать сразу несколько. Как например с позициями на Rust, там как правило нужны также знания C и C++. Или чудо изобретение от Qt под названием Qml: теперь на позицию C++ десктоп разработчика нужно знать C++/Js/Qml кайф.

rumgot ★★★★★
(13.09.25 22:07:58 MSK)

А зачем это нужно?

Я понимаю, кто-то захотел практики, но плеер, редактор или змейку не осилили.

Но почему это приняло такой серьезный оборот?

Не запилить ли в таком случае дистрибутив из рандомных github реп? А лучше билдить случайный образ из таких реп при каждом скачивании.

water_closed
(14.09.25 00:45:30 MSK)

Ссылка

Ответ на: комментарий от provaton 12.09.25 22:03:31 MSK

умение загрузить ядра ЦПУ - это фича, а не баг. Программу, которая грузит все ядра, можно запинить на одно ядро, можно поставить найс, чтоб понизить приоритет в шедулинге. Вариантов куча. Но если программа не умеет эффективно юзать железо, то ты уже сторонними средствами ее никак не ускоришь.

Умение загрузить все ядра вместо одного может быть полезным. Но если программа загружает 16 ядер вместо одного и при этом ускоряет работу всего лишь в полтора раза по сравнению с программой, которая загружает одно ядро, то эффективность на стороне однопоточника.

sena ★★★
(14.09.25 00:59:20 MSK)
Последнее исправление: sena 14.09.25 00:59:30 MSK (всего исправлений: 1)

Ответ на: комментарий от sena 14.09.25 00:59:20 MSK

да, логичное замечание.

provaton ★★★★★
(14.09.25 14:49:30 MSK)

Ссылка

Ответ на: комментарий от rumgot 13.09.25 22:07:58 MSK

меня коробит, что постоянно выходят очередные убийцы

вынуждены прыгать с языка на язык. Или знать сразу несколько.

Мне несложно разобраться, где убийца, а где нет. Хаскель, как сейчас помню, не дружил с OpenGL и субд, что сразу развенчало его как какого-либо убийцу в принципе. Язык D имел графическую библиотеку GL — удачи в гуглении. Эрланг оказался многословным для простейших вещей. Раст рожал хеллоу-ворлды в десяток мегабайт. Я не понимаю, как вы не понимаете. Много лет смотришь на некоторое дерьмо, а потом тебе в руки попадает зиг. Глоток свежего воздуха.

По мне так зиг убийца msvc и смейка. Под линуксы и юниксы слишком сильная конкуренция с имеющимися тулзами.

sarumeister ★
(15.09.25 05:14:11 MSK)

Ответ на: комментарий от sarumeister 15.09.25 05:14:11 MSK

а потом тебе в руки попадает зиг. Глоток свежего воздуха.

Что, вот прямо вот так вот и ощущается??.. ;)

Просто интересуюсь, безо «всякого вот этого»... :))

Somebody ★★★★
(15.09.25 05:17:21 MSK)

Ответ на: комментарий от sena 14.09.25 00:59:20 MSK

Умение загрузить все ядра вместо одного может быть полезным. Но если программа загружает 16 ядер вместо одного и при этом ускоряет работу всего лишь в полтора раза по сравнению с программой, которая загружает одно ядро, то эффективность на стороне однопоточника.

А если при этом доказано, что степень параллелизма алгоритма не более 1.52 на 16 потоках, а ты такой демонстрируешь 1.5, тогда как?

VIT ★★
(15.09.25 05:51:38 MSK)

Ответ на: комментарий от Somebody 15.09.25 05:17:21 MSK

а потом тебе в руки попадает зиг. Глоток свежего воздуха.

Что, вот прямо вот так вот и ощущается??.. ;)

Ему для работы нужна своя стдлиба в исходниках. Открываешь любой файл стдлибы и глаз радуется.

sarumeister ★
(15.09.25 06:30:14 MSK)

Ответ на: комментарий от sarumeister 15.09.25 05:14:11 MSK

Все так говорят, что уж их то любимая вундеовафля точно всем убийцам убийца.

rumgot ★★★★★
(15.09.25 07:47:24 MSK)
Последнее исправление: rumgot 15.09.25 07:47:48 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от sarumeister 15.09.25 05:14:11 MSK

Хаскель, как сейчас помню, не дружил с OpenGL и субд

https://habr.com/ru/articles/120686/

https://eax.me/haskell-postgresql-simple/

monk ★★★★★
(15.09.25 09:16:29 MSK)

Ссылка

Ответ на: комментарий от rumgot 13.09.25 22:07:58 MSK

Так не язык, так фреймворк. Вон JS один и тот же, но JQuery и React отличаются как бы не больше, чем Rust от С++.

А писать без дополнительных библиотек исключительно на интерфейсе ОС и стандартной библиотеке языка очень малопродуктивно.

monk ★★★★★
(15.09.25 09:20:22 MSK)

Ссылка

Ответ на: комментарий от sarumeister 15.09.25 06:30:14 MSK

Это пока не захочется, чтобы стдлиба была очень быстрой и очень гибкой.

Так-то и на Си можно на musl смотреть или на исходники из OpenBSD. По сравнению с glibc красота. Но работает медленнее.

monk ★★★★★
(15.09.25 09:22:51 MSK)

Ответ на: комментарий от monk 15.09.25 09:22:51 MSK

красота. Но работает медленнее

Это что бы красоту успеть рассмотреть?.. ;P ;))

Somebody ★★★★
(15.09.25 09:58:32 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 4 →

←	SRELL 4.069 — библиотека ECMAScript-совместимых регулярных выражений

Open Source

VirtualBox 7.2.2

→

Похожие темы