Нелогичная логика

Ответ на: комментарий от vbr 08.04.25 14:23:22 MSK

И, да, стандартная библиотека C отвратительна, тут подпишусь однозначно. Но ничего лучше я не знаю.

vbr ★★★★★
(08.04.25 14:27:42 MSK)

Ответ на: комментарий от alysnix 08.04.25 14:26:05 MSK

Справедливости ради, стоит отметить, что он как минимум по теме пишет :)

~~u5er~~ ★★★
(08.04.25 14:27:43 MSK) автор топика

Ответ на: комментарий от u5er 08.04.25 14:27:43 MSK

что он как минимум по теме пишет

он берет длину строки перед ее копированием. это избыточно. я б ему блевик поставил, но это будет горе матери и позор отца. потому не ставлю.

alysnix ★★★
(08.04.25 14:30:26 MSK)

Ответ на: комментарий от alysnix 08.04.25 14:30:26 MSK

Я полагаю, что это абстрактный пример. В реальном коде фактическая длина строки может быть уже заранее получена тем или иным путём.

~~u5er~~ ★★★
(08.04.25 14:33:17 MSK) автор топика

Ответ на: комментарий от alysnix 08.04.25 14:30:26 MSK

это избыточно.

Преждевременная оптимизация. GCC и Clang понимают семантику и хорошо оптимизируют использование стандартных строковых операций из string.h (str* и mem*).

anonymous
(08.04.25 14:35:39 MSK)

Ответ на: комментарий от u5er 08.04.25 14:22:03 MSK

ожидается

строка будет читаться

Ожидаться и читаться может кодом и программистом, который его писал. Поэтому повторю - всё зависит от того, что ты накодил. Если твой код для нуль-терминированных строк - просто не давай ему на вход результат strncpy. Но таким кодом мир не ограничивается, в ряде случаев используются другие способы определения длины.

firkax ★★★★★
(08.04.25 14:37:15 MSK)

Ответ на: комментарий от vbr 08.04.25 14:23:22 MSK

strcpy с проверкой в стандартной библиотеке нет. strlcpy это из BSD и в стандартном C такой функции нет. Если нужно такое поведение - значит либо пишешь такую функцию сам, либо подключаешь libbsd.

Смотря в чьей стандартной библиотеке. В bsd libc давным давно есть, например, в string.h. Да и вообще, он есть практически везде, glibc одно из редких исключений (а так же там же msvcrt): https://www.sourceware.org/glibc/wiki/strlcpy

firkax ★★★★★
(08.04.25 14:42:43 MSK)

Ответ на: комментарий от alysnix 08.04.25 14:09:47 MSK

Сишный стандарт, по неизвестной мне причине, до сих пор разрешает вызывать функции без объявления. Если функция не объявлена, то считается что все аргументы у неё int и возвращает она тоже int, ЕМНИП.

Угадай как код полагающийся на это ломается на LP64, например.

a1ba ★★★★
(08.04.25 14:44:30 MSK)
Последнее исправление: a1ba 08.04.25 14:44:52 MSK (всего исправлений: 1)

Ответ на: комментарий от anonymous 08.04.25 14:24:20 MSK

Нет там никакого UB, ноль-терминированные строки это библиотечная абстракция и реализация литералов в двойных кавычках, а не требование языка.

firkax ★★★★★
(08.04.25 14:44:33 MSK)

Ответ на: комментарий от firkax 08.04.25 14:42:43 MSK

В современных версиях glibc и он есть.

strlcpy и strlcat теперь часть стандарта. Не сишного, к сожалению, а POSIX.

a1ba ★★★★
(08.04.25 14:46:47 MSK)

Ответ на: комментарий от anonymous 08.04.25 14:35:39 MSK

GCC и Clang понимают семантику

разве из-за того, что компилятор якобы умный, имеет смысл писать неидеальные алгоритмы? алгоритм это семантика, сама по себе, вне наличия и качества компилятора.

alysnix ★★★
(08.04.25 14:46:51 MSK)

Ответ на: комментарий от firkax 08.04.25 14:44:33 MSK

ноль-терминированные строки это библиотечная абстракция

это способ представления текстовых строк еще от эпохи ассемблеров. откуда оно и перекочевало в си. а не какая-то там «абстракция».

alysnix ★★★
(08.04.25 14:49:57 MSK)

Ответ на: комментарий от firkax 08.04.25 14:44:33 MSK

Нет там никакого UB

https://en.cppreference.com/w/c/string/byte/strlen

The behavior is undefined if str is not a pointer to a null-terminated byte string.

ноль-терминированные строки это библиотечная абстракция …, а не требование языка.

string.h - входит в стандарт языка и это стандартная библиотека языка.

anonymous
(08.04.25 14:56:18 MSK)

Ответ на: комментарий от alysnix 08.04.25 14:46:51 MSK

имеет смысл писать неидеальные алгоритмы?

Алгоритмы надо писать корректные, удовлетворяющие условиям. В условиях есть требование не использовать strlen?

anonymous
(08.04.25 14:59:57 MSK)

Ответ на: комментарий от anonymous 08.04.25 14:59:57 MSK

Алгоритмы надо писать корректные, удовлетворяющие условиям. В условиях есть требование не использовать strlen?

мельчите, алгоритмы должны быть минимальной вычислительной сложности, при соблюдении требований к их функциональности.

фактически время работы приведеннного куска кода увеличивается вдвое, просто потому, что там избыточные операции

alysnix ★★★
(08.04.25 15:09:17 MSK)

Ответ на: комментарий от alysnix 08.04.25 15:09:17 MSK

алгоритмы должны быть минимальной вычислительной сложности

Это огромный-огромный словарь на много-много параметров, который сразу [O(1)] возвращает результат по входным параметрам.

anonymous
(08.04.25 15:14:28 MSK)

Ответ на: комментарий от anonymous 08.04.25 15:14:28 MSK

какой еще словарь? вот код, что фиркакс написал в целях познавательных. а я сказал, что длина не нужна и всю логику надо привести к более стройной. и усьо!

len = strlen(src);
if(len>=buflen) { fprintf(stderr,"string overflow!\n"); abort(); }
bcopy(src, buf, len);
buf[len] = 0;

alysnix ★★★
(08.04.25 15:17:14 MSK)

Ответ на: комментарий от alysnix 08.04.25 15:17:14 MSK

У вас просто разный набор «стандартных» функций, которые «разрешено» использовать в алгоритме. Разный базис - разные коэфициенты вектора (одного и того же). Но результат (должен быть) один.

anonymous
(08.04.25 15:23:04 MSK)

Ответ на: комментарий от anonymous 08.04.25 15:23:04 MSK

У вас просто разный набор «стандартных» функций, которые «разрешено» использовать в алгоритме.

так не бывает. алгоритм первичен, набор стандартный - вторичен. если он не устраивает - делай свой набор. стандартные функции это просто множество неких удобных абстракции и функций, который выбрали голосованием, и к которому вас никто гвоздями не прибил.

да там вроде и на стандартных функциях можно делать корректно и без длины. лень хелпы смотреть

alysnix ★★★
(08.04.25 15:28:23 MSK)

Ответ на: комментарий от alysnix 08.04.25 15:28:23 MSK

алгоритм первичен

Нет. Как минимум алгоритмы можно реализовать на машине Тьюринга или как лямбда-исчисление. Это разные алгоритмы, с разным пониманием вычислительной сложности. Не говоря о разных алгоритмах в зависимости от сложности базовых/элементарных операций, например, какая-нибудь «квантовая машина» считает интегралы быстрее, чем ужножает/делит.

anonymous
(08.04.25 15:40:34 MSK)

Ответ на: комментарий от anonymous 08.04.25 15:40:34 MSK

Нет. Как минимум алгоритмы можно реализовать на машине Тьюринга или как лямбда-исчисление.

какая разница на чем ты будешь перебирать массив, если это не нужно. на машине тюринга или лямбда-исчислением. ты будешь заниматься лишними операциями просто потому, что так написано в неправильном императивном алгоритме. а в правильном - этого не будет.

alysnix ★★★
(08.04.25 16:00:48 MSK)

Ответ на: комментарий от alysnix 08.04.25 16:00:48 MSK

какие-то пердольские заморочки

anonymous
(08.04.25 16:02:51 MSK)

Ответ на: комментарий от vbr 08.04.25 13:47:47 MSK

Например в этом коде использовать что-либо кроме strcpy не уместно:

vbr - я тебя понимаю, но ведь в реальном коТе в 99.9% будет:

strcpy(buf, stroka_ot_usera_Vasi_ya_emu_doveryau_pili_kakto_vmeste);

И тебя поимеют :)

Спор ни о чём, об этом спорят столько, сколько Си существует.

Я лично считаю что самая главная характеристика Си - это то, что он «высокоуровневый ассемблер»(C)… Писать приложухи на нём не надо, только ту часть в них где происходит лютый байтодроЧЪ (кодек к примеру), либо драйверы какие, либо кишки ОС\FS … потому как «настоящий» ЯП там только мешает :)

Но в ойТи принято есть суп вилкой, это наше всЁ :)

anonymous
(08.04.25 16:20:06 MSK)

Ответ на: комментарий от vbr 08.04.25 14:07:31 MSK

Нужен безопасный язык - берите Rust. Или Go. Или Python.

Java, JS\TS, Swift

Да хоть Ocaml! - там наконец то ну гру-гря то, что в питоне называют GIL - похерили и он теперь сЪест все ваши корки :)

Полно ведь ЯП-шек, на все вкусы и стли - по паре … нет ЯЪ! - берут сишку и лепят очередной «склад\магазин» … Зойчем?!?!? :(

anonymous
(08.04.25 16:28:13 MSK)

Ответ на: комментарий от anonymous 08.04.25 16:28:13 MSK

Зойчем

~~Зашкафом~~ Потому что желание совпадает с возможностями! =P

~~u5er~~ ★★★
(08.04.25 16:29:45 MSK) автор топика

Ответ на: комментарий от u5er 08.04.25 14:13:09 MSK

Спасибо, но я возьму аду при необходимости.

James Bond-ы докладывают что она только на Бериеве (да у то где то в уголочке) осталась :( Но таки да:

Ada

anonymous
(08.04.25 16:32:28 MSK)

Ответ на: комментарий от u5er 08.04.25 16:29:45 MSK

Зойчем?! Зашкафом! Потому что желание совпадает с возможностями! =P

От-тожЪ(C) :)

PS: Чтобы потушить пожар залив его … бензином ;-D - предлагаю вам ещё тему «Корректная и эффективная обработка UTF (UTF-8) строк в языке Си» …

PPS: Вот я сволочь 8-)

anonymous
(08.04.25 17:19:12 MSK)

Ответ на: комментарий от anonymous 08.04.25 17:19:12 MSK

Корректная и эффективная обработка UTF (UTF-8) строк в языке Си

Поздно: я уже занимаюсь этим в контексте написания своей операционки =P Не уверен, что получается корректно и эффективно, но лыжи едут.

~~u5er~~ ★★★
(08.04.25 17:25:39 MSK) автор топика

Ответ на: комментарий от a1ba 08.04.25 14:46:47 MSK

POSIX это и есть сишный стандарт. Точнее, стандарт на стандартную библиотеку языка - самый авторитетный из существующих, хоть и не идеальный.

firkax ★★★★★
(08.04.25 18:23:08 MSK)

Ответ на: комментарий от anonymous 08.04.25 17:19:12 MSK

Корректная и эффективная обработка UTF (UTF-8) строк в языке Си» …

Корректная обработка их весьма простая, а вот насчёт эффективной - это невозможно, и язык тут ни при чём. Виноват сам utf-8, что в нём для вычисления индекса символа надо сканировать всю строку до него. Это на любом языке будет уродливый оверхед (хотя на некоторых он может быть и спрятан от кодера внутрь библиотеки, но он от этого не исчезает).

firkax ★★★★★
(08.04.25 18:28:58 MSK)
Последнее исправление: firkax 08.04.25 18:29:43 MSK (всего исправлений: 1)

Ответ на: комментарий от firkax 08.04.25 18:23:08 MSK

POSIX это и есть сишный стандарт

Ни разу. POSIX -> Portable Operating System Interface. Про язык си тут ни слова.

~~u5er~~ ★★★
(08.04.25 18:35:43 MSK) автор топика

Ответ на: комментарий от firkax 08.04.25 18:28:58 MSK

для вычисления индекса символа надо сканировать всю строку до него.

Если оптимизировать по скорости, то можно использовать uint32_t для хранения каждого символа, тогда доступ будет быстрым.

~~u5er~~ ★★★
(08.04.25 18:36:58 MSK) автор топика

Ответ на: комментарий от u5er 08.04.25 18:35:43 MSK

Си это язык, на котором пишут программы, а POSIX (один из его разделов) - стандарт на апи между ОС (включая libc) и программами. То есть именно это стандарт на системную библиотеку.

firkax ★★★★★
(08.04.25 18:57:22 MSK)

Ответ на: комментарий от u5er 08.04.25 18:36:58 MSK

Хранить так конечно можно, только это будет уже не utf-8. utf-8 это именно неудобная для софта кодировка с переменной длиной символа. Хотя у неё и есть другие плюсы, ради которых с ней мирятся.

firkax ★★★★★
(08.04.25 18:58:27 MSK)

Ответ на: комментарий от firkax 08.04.25 18:57:22 MSK

POSIX это и есть сишный стандарт

это стандарт на системную библиотеку

«Эволюция» стандарта за несколько часов.

Тем временем POSIX-2024 поддерживат только C17, хотя уже вышел С23.

anonymous
(08.04.25 19:20:35 MSK)

Ответ на: комментарий от firkax 08.04.25 18:58:27 MSK

кодировка с переменной длиной символа

Что такое символ? В терминах Unicode?

Есть лигатуры.

Есть составные. https://en.wikipedia.org/wiki/Combining_character

Это какая длина символа?

anonymous
(08.04.25 19:29:32 MSK)

Ответ на: комментарий от u5er 08.04.25 13:30:23 MSK

Версию компилятора в студию.

LongLiveUbuntu ★★★★★
(08.04.25 20:08:47 MSK)

Ответ на: комментарий от u5er 08.04.25 13:50:45 MSK

нестандартные функции

Ну, ты понял.

LongLiveUbuntu ★★★★★
(08.04.25 20:10:59 MSK)

Ответ на: комментарий от anonymous 08.04.25 16:28:13 MSK

Java

Слишком тяжелый.

JS/TS

Пол-интернета надо загружать.

Swift

Анально огороженный

LongLiveUbuntu ★★★★★
(08.04.25 20:34:22 MSK)

Ответ на: комментарий от LongLiveUbuntu 08.04.25 20:08:47 MSK

gcc-13.2.0_3

~~u5er~~ ★★★
(08.04.25 20:40:48 MSK) автор топика

Ответ на: комментарий от firkax 08.04.25 14:13:05 MSK

bcopy(src, buf, len);

Чем memcpy() не устраивает?

iron ★★★★★
(08.04.25 21:11:34 MSK)

Ответ на: комментарий от u5er 08.04.25 20:40:48 MSK

Там вроде С11 по дефолту уже. Точно не С99. Указывай стандарт руками.

LongLiveUbuntu ★★★★★
(08.04.25 21:48:26 MSK)

Ответ на: комментарий от u5er 08.04.25 18:36:58 MSK

Нет практической необходимости адресовать текстовые строки посимвольно, поэтому удобнее хранить символы как последовательности байт.

pasquale ★
(08.04.25 22:29:49 MSK)

Ответ на: комментарий от iron 08.04.25 21:11:34 MSK

Перефразирую: чем bcopy не устраивает?

Вообще, на самом деле причины (заранее согласен что ни одна из них не критическая) предпочитать bcopy есть:

1) он занимает на 1 символ меньше чем memcpy и на 2 символа меньше чем memmove (и кстати он аналог второго а не первого)

2) memcpy нету в 4.2BSD, а bcopy - есть

3) memcpy замешан в скандале с некими умниками, испортившими его исторически принятое поведение (копирование строго снизу вверх), и что самое плохое - эту регрессию так и не откатили

4) используя набор bcopy/bcmp/bzero вместо соответствующих memXXX, мы экономим не только символы в названиях функций, но и лишний аргумент у memset (кстати была история, когда из-за бага memset всегда заполнял память нулями и игнорил второй аругмент - и вроде бы это никто так и не заметил на практике).

firkax ★★★★★
(08.04.25 23:10:14 MSK)

Ответ на: комментарий от firkax 08.04.25 23:10:14 MSK

он занимает на 1 символ меньше чем memcpy и на 2 символа меньше чем memmove (и кстати он аналог второго а не первого)

При оптимизации -O2 результирующему коду пофигу сколько там символов в названии функций.

memcpy нету в 4.2BSD, а bcopy - есть

Ок, но при написании новый программы, какова вероятность что ее будут запускать на системе до 4.2BSD? Подозреваю, что околонулевая. К тому, же это уже легаси:

     IEEE Std 1003.1-2008 (“POSIX.1”) removes the specification of bcopy() and
     it is marked as LEGACY in IEEE Std 1003.1-2004 (“POSIX.1”).  New programs
     should use memmove(3).  If the input and output buffer do not overlap,
     then memcpy(3) is more efficient.

К тому же, memcpy() и собратья в FreeBSD имеют оптимизации с использованием SIMD инструкций для ускорения копирования блоков памяти, в отличие от bcopy().

iron ★★★★★
(09.04.25 00:38:02 MSK)

Ответ на: комментарий от iron 09.04.25 00:38:02 MSK

1. Причём тут результирующий код? Он и без оптимизаций вообще от названий функций не зависит. Речь про то что надо на 1 кнопку меньше нажимать когда пишешь код.

2. Ну я сразу сказал что причины эти некритичные.

Насчёт «легаси» и ссылок на всякие стандарты - это всё ерунда. Никто bcopy удалять не собирается и никогда не удалит.

Насчёт оптимизаций: вот общий исходник для bcopy, memcpy и memmove - отличия только в ifdef-ах, вот ссылка на него для memcpy и для memmove.

Для amd64 действительно есть оптимизированная реализация. Вот она: bcopy memcpy memmove. Опять та же история с общим исходником и алиасами к нему.

Где simd я не нашёл, но если он там где-то есть то очевидно по той же схеме.

Так что это всё одно и то же сейчас, разница реально только в количестве букв для набора на клавиатуре.

firkax ★★★★★
(09.04.25 01:35:25 MSK)
Последнее исправление: firkax 09.04.25 01:37:58 MSK (всего исправлений: 1)

Ответ на: комментарий от firkax 09.04.25 01:35:25 MSK

Никто bcopy удалять не собирается и никогда не удалит.

Надо спросить у оффтопщиков (win msvc, macos), есть ли у них в стандартной libc bcopy и тп.

https://godbolt.org при выборе msvc ругается на отсутствие bcopy. Значит, кто-то удалил.

anonymous
(09.04.25 02:47:46 MSK)

Ответ на: комментарий от anonymous 09.04.25 02:47:46 MSK

У них его и не было. Ладно, признаю что использование bcopy может нарушить совместимость с оффтопиком. В любом случае, для смысла примера это несущественно (как и место подсчёта длины строки, к которому кто-то придрался).

firkax ★★★★★
(09.04.25 12:17:20 MSK)

Ответ на: комментарий от firkax 09.04.25 01:35:25 MSK

чё-то как-то ты сам себя приложил:

void
bcopy(const void *src, void *dst, size_t len)
{

	memmove(dst, src, len);
}

anonymous
(09.04.25 12:20:22 MSK)

Ответ на: комментарий от firkax 09.04.25 01:35:25 MSK

ещё memmove может быть медленнее memcpy

anonymous
(09.04.25 12:23:11 MSK)

Похожие темы