Создание строки в C (СИ)

Ответ на: комментарий от fsb4000 19.02.18 17:45:49 MSK

Охотно верю, видимо у вас максимальная длинна строки и средняя длинна строки близки...

Что? При strncpy длина строки не вычисляется (если, конечно, не говнокодить, а использовать stncpy по назначению, задавая третий параметр равный размеру буфера), а у тебя вычисляется.

~~redgremlin~~ ★★★★★
(19.02.18 17:50:37 MSK)

Ответ на: комментарий от redgremlin 19.02.18 17:50:37 MSK

И?

Да, в моём варианте длина строки вычисляется. Но зато просто копируются данные, а не проверяется каждый символ с равенством на '\0' и не заполняется остаток буфера нулями..

fsb4000 ★★★★★
(19.02.18 17:57:38 MSK)

Ссылка

Ответ на: комментарий от sniper21 19.02.18 16:23:03 MSK

Пока мне достаточно если С строки будут быстрее std::string :)

Во многих случаях std::string будет быстрее char*, как раз из-за наличия размера. В стандартном C-api практически все операции со строками предполагают пробег по ним в поисках завершающего '\0'. В std::string и предлагаемом варианте он известен заранее.

Так же есть small string optimization, которая на 64-битах и мелких строках может дать вполне весомое преимущество перед аллокацией char*. Если данные подходят.

Ну и вообще, std::string может заметно отличаться по скорости от char*, только если его бездумно копируют или создают на каждый чих. Используй std::string_view и всё будет быстро и удобно.

Ivan_qrt ★★★★★
(19.02.18 18:29:42 MSK)

Ответ на: комментарий от sniper21 19.02.18 16:23:03 MSK

На больших строках будет заметно, так как strcat/strcpy/strXXX это вечный strlen

linuhs_user ★
(19.02.18 18:36:02 MSK)

https://github.com/antirez/sds На вот тебе строки крутые, их юзай.

linuhs_user ★
(19.02.18 18:59:58 MSK)

Ответ на: комментарий от linuhs_user 19.02.18 18:59:58 MSK

автор явно не любит разделители в идентификаторах

sds sdsjoinsds(sds *argv, int argc, const char *sep, size_t seplen);

ну и всё в таком духе

anonymous
(19.02.18 19:09:41 MSK)

Ответ на: комментарий от anonymous 19.02.18 19:09:41 MSK

Следует стилю strlen,strcpy,sprintf,sscanf

linuhs_user ★
(19.02.18 19:13:20 MSK)

char *temp = NULL;
asprintf(&temp, "%s", "Privet, LOR");
free(temp);

anmg
(19.02.18 19:24:08 MSK)

Ссылка

Ответ на: комментарий от anonymous 19.02.18 11:10:10 MSK

процедура main это S : Неограниченная_Строка

Очень выразительный язык. Читаешь и сразу понятно, что процедура — это строка.

utf8nowhere ★★★★
(19.02.18 19:36:03 MSK)

Ссылка

Ответ на: комментарий от linuhs_user 19.02.18 19:13:20 MSK

На самом деле нет, в стандартной библиотеке 1-2 слова + префикс/суффикс, за счёт этого идентификатор короткий и легко воспринимается при чтении, а в этой либе суммарная длина гораздо больше и получается нечитаемое говно

anonymous
(19.02.18 20:10:52 MSK)

Ответ на: комментарий от linuhs_user 19.02.18 18:59:58 MSK

man sbuf

anonymous
(19.02.18 20:15:30 MSK)

Ответ на: комментарий от linuhs_user 19.02.18 18:59:58 MSK

Нетипизированный адок. В духе сишки.

~~RazrFalcon~~ ★★★★★
(19.02.18 20:59:06 MSK)

Ссылка

Ответ на: комментарий от pftBest 19.02.18 17:00:52 MSK

Ну и причём тут ada и твой ковнокод?

anonymous
(19.02.18 21:12:06 MSK)

Ссылка

Ответ на: комментарий от anonymous 19.02.18 20:10:52 MSK

Я с иронией.

linuhs_user ★
(19.02.18 21:42:08 MSK)

Ответ на: комментарий от anonymous 19.02.18 20:15:30 MSK

$ man sbuf
Нет справочной страницы для sbuf

linuhs_user ★
(19.02.18 21:42:40 MSK)

Ссылка

Ответ на: комментарий от linuhs_user 19.02.18 21:42:08 MSK

Я понимаю, но стиль стандартной библиотеки не так плох, но надо понимать в чём его преимущества

anonymous
(19.02.18 22:09:41 MSK)

Ссылка

Не, явно Борька Керниганов с Дениской Ритчевым что-то не додумали, когда сочиняли язык Си.

praseodim ★★★★★
(20.02.18 02:38:28 MSK)

Ссылка

Если нужен буфер для работы:

char temp[256] = "Privet, LOR";

strncpy(temp, "something else", sizeof(temp)); /* а ещё лучше strlcpy() */

Если нужна просто аллоцированная строка:

char *temp = strdup("Privet, LOR"); /* убирает все эти ритуальные пляски с ручным malloc, numchars и sizeof */

Если нужна просто константная строка:

const char *temp = "Privet, LOR";

anonymous
(20.02.18 03:44:09 MSK)

Ответ на: комментарий от anonymous 20.02.18 03:44:09 MSK

а ещё лучше strlcpy()

С сями знаком без году неделя, но уже мечтаю чтобы её добавили в C20

sniper21 ★★★★★
(20.02.18 08:15:30 MSK) автор топика

Ссылка

Немного оффтоп: и много ты могучего-великого софта не имеющего аналогов напишешь, если будешь тупить над примитивными азами, над крохами? Ползать как червь по земле с malloc, когда мог бы парить как орел в высоких абстракциях?

I-Love-Microsoft ★★★★★
(20.02.18 17:38:36 MSK)

Ответ на: комментарий от I-Love-Microsoft 20.02.18 17:38:36 MSK

Люди ведутся на слоган «сишка быстрая», но не понимают какой ценой достигается такая производительность.

~~RazrFalcon~~ ★★★★★
(20.02.18 18:06:43 MSK)

Ответ на: комментарий от RazrFalcon 20.02.18 18:06:43 MSK

Люди ведутся на слоган «сишка быстрая», но не понимают какой ценой достигается такая производительность.

Всё я понимаю.

sniper21 ★★★★★
(20.02.18 22:48:48 MSK) автор топика

Ссылка

Ответ на: комментарий от I-Love-Microsoft 20.02.18 17:38:36 MSK

Немного оффтоп: и много ты могучего-великого софта не имеющего аналогов напишешь, если будешь тупить над примитивными азами, над крохами? Ползать как червь по земле с malloc, когда мог бы парить как орел в высоких абстракциях?

Вах, какой красивый тост! Только переписываю я утилитку на 400 строк с C++ на C, дабы удовлетворить одному непростому требованию.

sniper21 ★★★★★
(20.02.18 22:49:56 MSK) автор топика

Ответ на: комментарий от sniper21 20.02.18 22:49:56 MSK

дабы удовлетворить одному непростому требованию.

Что там за требование такое?

anonymous
(20.02.18 22:53:05 MSK)

Ответ на: комментарий от redgremlin 19.02.18 17:35:09 MSK

Т.е. ты сел в лужу? Хорошо, так и запишем. А для того, чтобы помножить тебя на ноль - я скажу одно слово heartbleed, повторю и тут.

~~vcerloman~~
(20.02.18 23:25:44 MSK)

Ответ на: комментарий от sniper21 20.02.18 22:49:56 MSK

одному непростому требованию

Недостаток бекдоров?

~~RazrFalcon~~ ★★★★★
(20.02.18 23:25:45 MSK)

Ссылка

Ответ на: комментарий от Ivan_qrt 19.02.18 18:29:42 MSK

Во многих случаях std::string будет быстрее char*, как раз из-за наличия размера.

Нет, std::string может только что-то лишь благодаря тому, что это обёртка над string.h

как раз из-за наличия размера.

Ничего не даёт в большинстве операций.

В стандартном C-api практически все операции со строками предполагают пробег по ним в поисках завершающего '\0'.

Что есть бесплатно. Ну и да, особенно те, что закалхожены в char_traits<char>.

Так же есть small string optimization, которая на 64-битах и мелких строках может дать вполне весомое преимущество перед аллокацией char*. Если данные подходят.

Это колхоз, который никакой «аллокации char *» не противоречит. Аллокация char * намного мощнее, ведь он не ограничена ничем.

Ну и вообще, std::string может заметно отличаться по скорости от char*, только если его бездумно копируют или создают на каждый чих. Используй std::string_view и всё будет быстро и удобно.

std::string на то и существует, что-бы «копироваться» - это раишное дерьмо. И когда ты начинаешь говорить про std::string_view, который ортогонален std::string и раишному дерьму, и является тем же самым, чем является char * - это выглядит как-то странно.

Где-то тут на лоре есть мой ultrafast_strlen(), который за O(1) даёт длину для маллочных сишных строк, но его вроде потёрли.

~~vcerloman~~
(20.02.18 23:37:59 MSK)

Добавлю ещё, что malloc лет 30 уже как не кастят. Где вы берёте таки устаревшие привычки?

PS: про strdup уже вспоминали?

beastie ★★★★★
(20.02.18 23:57:09 MSK)
Последнее исправление: beastie 21.02.18 00:01:47 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от linuhs_user 19.02.18 18:36:02 MSK

Ты явно чего-то не знаешь. strcpy - там нет strlen по определению, даже в самых колхозных имплементациях его не используют.

Почти ни в каких операциях strlen"а нет.

~~vcerloman~~
(21.02.18 00:05:26 MSK)

Ссылка

Ответ на: комментарий от linuhs_user 19.02.18 18:59:58 MSK

https://github.com/antirez/sds/blob/master/sds.c#L777

О боже, ты хоть не позорился бы это постить.

Убогий и тормозной колхоз, который ни на грамм не конкурентоспособен glibc.

~~vcerloman~~
(21.02.18 00:10:40 MSK)

Ответ на: комментарий от vcerloman 21.02.18 00:10:40 MSK

И в чём тормоза?

anonymous
(21.02.18 01:46:31 MSK)

Ответ на: комментарий от vcerloman 20.02.18 23:37:59 MSK

ultrafast_strlen(), который за O(1) даёт длину для маллочных сишных строк

Я не видел, расскажи еще раз.

pftBest ★★★★
(21.02.18 02:01:43 MSK)

Ответ на: комментарий от pftBest 21.02.18 02:01:43 MSK

static inline size_t ultrafast_strlen(char * str) {
  
  typedef union {
    size_t data;
      struct {
        size_t __flag0: 1;
        size_t is_mmaped: 1;
        size_t __flag2: 1;
        size_t size: 61;
      };
  } chunk_size_t;
  
  chunk_size_t chunk = {.data = *(size_t *)(str - 8)};
  
  size_t size = chunk.size << 3;
  size_t align = (chunk.is_mmaped ? 4096 : 16);
  size_t overhead = (chunk.is_mmaped ? 16 + 8 : 8);
  size_t end_pos = size - overhead; 
  size_t start_pos = (end_pos - align + 1);
  
  start_pos -= 1;
  
  start_pos = (start_pos < 10) ? 0 : start_pos;
  
  return start_pos + strlen(str + start_pos);
}

Как-то так. Суть в том, что маллок уже хранит длину чанка. А т.к. шаг длинны чанка не равен байту, то при одной и той же длине чанка - длина строки может быть разной. Максимальную её длину + 1 - можно получить с malloc_usable_size(). Для минимальной нужен колхоз.

А дальше всё просто - пускаем strlen() от минимального и прибавляет минимальный.

~~vcerloman~~
(21.02.18 03:48:31 MSK)

Ответ на: комментарий от anonymous 21.02.18 01:46:31 MSK

Во всём? Как минимум в том, что для sdscmp() не нужен strlen(), но колхозники этого не знают, поэтому ваяют это дерьмо, чтобы strlen() не тормозил. Это что касается ссылки.

А в целом - полный ахтунг. Начиная с того, что это колхоз-сишка, на которой можно написать только мусор. Писали это явно те, кто писать не может. Да и вообще это колхоз-обёртка над libc, которая ничего не делает.

Мне лень всё разбирать. Я увидел только одну функцию, которой нужен не сишный strlen(). Второй оно нужно только для валидации аргументов. Далее там пошло отборное, и может там то же что-то есть.

https://github.com/antirez/sds/blob/master/sds.c#L829 - полный аутизм. Похоже ещё про strstr() не рассказали. Ну ничего - завтра пацанам расскажут - они перепишут.

https://github.com/antirez/sds/blob/master/sds.c#L869 - это вообще комментировать не имеет смысла.

Хотя нет, вру. https://github.com/antirez/sds/blob/master/sds.c#L1063 - это ещё лучше. Долбим квадрат - нахрен таблицу.

https://github.com/antirez/sds/blob/master/sds.c#L439 - убожество. Контекст ограничен SDS_LLSTR_SIZE, и казалось бы - пиши с конца, а после делай move, но нет - пацаны это ещё не изучали.

Ну и копипаста явно в крови у пацанов.

https://github.com/antirez/sds/blob/master/sds.c#L499 - датычё

https://github.com/antirez/sds/blob/master/sds.c#L507 - мы везде делаем setlen, но что-то тут у нас не смоглось - копируем.

Колхозные принтф"ы даже комментировать лень.

https://github.com/antirez/sds/blob/master/sds.c#L527 - брутфорсим sprintf.

https://github.com/antirez/sds/blob/master/sds.c#L513 - это для того, чтобы пациенты мне не вещали о том, что «они на самом деле не неосилили таблицы, просто память экономили» - ога.

https://github.com/antirez/sds/blob/master/sds.c#L693 - а вот и проявление неосиляторства таблиц.

https://github.com/antirez/sds/blob/master/sds.c#L763 - а что не используют свою функцию реплейса? Там же по идее точно так же должны долбить в два фора.

И конечно же, тут нет ни ОДНОГО намёка на хоть какую-то оптимизацию, даже самую малую. Хотя нет, вижу - вижу:

https://github.com/antirez/sds/blob/master/sds.c#L903 - таблица, ну как таблица - мусор, но всё же компилятор сделает из неё таблицу. Хотя нет, пацаны ведь с Os собирают.

Про то, как это написано - я даже рассказывать не буду - меня заклюют. Хотя нет, пацаны с c99 собирают.

https://github.com/antirez/sds/blob/master/sds.c#L761 - ну ничего, похоже c99 - это только для понтов. Ну ничего, я верю, что пацаны смогут осилить.

А особенно меня умиляет pedantic, но при этом __attribute__ в хедерах. Это такая клоунада.

Да, после такого понимаешь, почему си считают дерьмом и молятся на кресты.

~~vcerloman~~
(21.02.18 05:26:14 MSK)

Ответ на: комментарий от vcerloman 21.02.18 05:26:14 MSK

Да, после такого понимаешь, почему си считают дерьмом и молятся на кресты.

Жопорукие быдлокодеры везде встречаются. Это не значит, что язык — говно!

Набыдлокодить и на пхытоне можно так, что волосы дыбом встанут! И даже круче, потому как пхытон — говноЯП, предназначенный именно для быдлокодинга.

anonymous
(21.02.18 08:07:33 MSK)

Ссылка

Ответ на: комментарий от sniper21 19.02.18 16:23:03 MSK

std::string будет быстрее, потому что для твоей маленькой строки std::string даже не будет аллоцировать память. К тому же std::string отлично оптимизируется: https://godbolt.org/g/ifmC1J

rupert ★★★★★
(21.02.18 08:17:02 MSK)

Ссылка

Ответ на: комментарий от anonymous 20.02.18 22:53:05 MSK

Если всё пройдет хорошо, то я покажу и свяжу с этим тредом :)

sniper21 ★★★★★
(21.02.18 08:41:47 MSK) автор топика

Ссылка

Ответ на: комментарий от vcerloman 20.02.18 23:25:44 MSK

Т.е. ты сел в лужу?

Странно, сказать нечего тебе, а в лужу сел я.

я скажу одно слово heartbleed

Можешь сказать ещё фуарЫВДРАывраплынвпанп и другие слова, смысла которых ты не понимаешь, но это, как, впрочем, и всегда, смысла твоим словам не добавит.

~~redgremlin~~ ★★★★★
(21.02.18 08:48:20 MSK)

Народ а есть в C функция по типу strXcpy(char* to, const char* from, size_t max_cpy);.
Копирующую как strcpy но не больше max_cpy char'ов, да ещё и зануляющую последний char.
Понятно что это можно и самому запилить, но всё же?

anonymous
(21.02.18 09:22:12 MSK)

Ссылка

Ответ на: комментарий от vcerloman 21.02.18 03:48:31 MSK

А ты в курсе, что это не O(1)?

anonymous
(21.02.18 10:08:36 MSK)

Ответ на: комментарий от vcerloman 21.02.18 05:26:14 MSK

Во всём? Как минимум в том, что для sdscmp() не нужен strlen()

В sdscmp нет вызова strlen

anonymous
(21.02.18 12:09:16 MSK)

Ответ на: комментарий от anonymous 21.02.18 10:08:36 MSK

А ты в курсе, что это не strlen?

aedeph_ ★★
(21.02.18 12:24:40 MSK)

Ответ на: комментарий от vcerloman 21.02.18 03:48:31 MSK

Правильно что удалили, убивать за такое надо. Ты завязался на детали реализации и сделал решение, которое несовместимо ни со строками на стеке, ни с обычной для C работой с указателями, аля str + bytes_to_skip, и при этом ещё и работает неправильно с преаллоцированным с запасом буфером. Если готов со всем этим расстаться, не парь мозг, заведи структуру типа

struct string {
   size_t capacity, length;
   char data[1];
}

и получишь реально O(1) strlen и без опасности сломать программу невинным редактированием.

khrundel ★★★★
(21.02.18 13:45:36 MSK)

Ответ на: комментарий от aedeph_ 21.02.18 12:24:40 MSK

В курсе, а ещё я в курсе что strlen вызывается в этой функции:

return start_pos + strlen(str + start_pos);

anonymous
(21.02.18 15:09:47 MSK)

Ответ на: комментарий от anonymous 21.02.18 10:08:36 MSK

Это O(1), иди перечитай букварь.

~~vcerloman~~
(21.02.18 15:20:59 MSK)

Ссылка

Ответ на: комментарий от anonymous 21.02.18 12:09:16 MSK

А ты явно читать не умеешь, но я для тебя разберу:

Во всём? Как минимум в том, что для sdscmp() не нужен strlen(), но колхозники этого не знают, поэтому ваяют это дерьмо, чтобы strlen() не тормозил. Это что касается ссылки.

Т.е., тут говорится о том, что для strcmp() не нужен strlen(), но колхозники этого не знают. От того они прикручивают к строке len, и делают strlen(), который не тормозит. Т.е. это не нужно.

~~vcerloman~~
(21.02.18 15:22:51 MSK)

Ссылка

Ответ на: комментарий от khrundel 21.02.18 13:45:36 MSK

Меня твоё «мнение» мало интересует, как и твои глупые попытки что-то мне рассказывать. Меня не интересуют проблемы, которые возникают у всяких балаболов.

~~vcerloman~~
(21.02.18 15:29:02 MSK)

Ответ на: комментарий от vcerloman 20.02.18 23:37:59 MSK

Нет, std::string может только что-то лишь благодаря тому, что это обёртка над string.h

И что это меняет? Ты опровергаешь то, что std::string может быть быстрее char* тем, что std::string может использовать string.h? Логика тебе чужда, я смотрю.

Ничего не даёт в большинстве операций.

В большинстве или нет, зависит от данных и набора операций. Но хорошо хоть не во всех. Уже прогресс. Скоро начнёшь понимать, что выйгрыш в некоторых операциях - тоже выйгрыш.

Что есть бесплатно.

Только если тебе в рамках алгоритма нужно бежать по строке. И то, для некоторых задач, типа проверки на равенство, если размер обеих строк известен заранее, и он разный, можно вообще не бегать. А некоторые алгоритмы, благодаря известному размеру, можно оптимизировать.

Это колхоз, который никакой «аллокации char *» не противоречит. Аллокация char * намного мощнее, ведь он не ограничена ничем.

Ну и что это за бред? Причём тут противоречия, ограничения и мощность? Тебе русским языком сказано, что на 64-битах для мелких строк, std::string, благодаря sso, будет быстрее, чем выделение памяти на куче. Что тут можно было не понять?

std::string на то и существует, что-бы «копироваться» - это раишное дерьмо. И когда ты начинаешь говорить про std::string_view, который ортогонален std::string и раишному дерьму, и является тем же самым, чем является char *

Царь не осилил raii и string_view. Но мнение имеет. Впрочем как обычно.

Где-то тут на лоре есть мой ultrafast_strlen(), который за O(1) даёт длину для маллочных сишных строк, но его вроде потёрли.

Твой ultrafast_высер() кусок говна, неприменимый в адекватных проектах. Оставь его себе и больше не выкладывай.

Ivan_qrt ★★★★★
(21.02.18 15:33:34 MSK)

Ответ на: комментарий от redgremlin 21.02.18 08:48:20 MSK

Странно, сказать нечего тебе, а в лужу сел я.

Нет, это тебе нечего сказать. Но давая я поясню для пацанов.

Данный балабол, услышав где-то за партой про strn - начал вещать о том, что «безопасно» и прочий колхоз. Ему рассказали о том, что из сети берутся не только данные, но и их длина.

На что данный балабол поплыл и начал нести ахинею вида «нет, не берутся» - т.е. уже сел в лужу.

А после, а ему дал отсылку на heartbleed, в котором проблема была именно в том, что длина бралась из сети.

Теперь, этот балабол начинает играть в идиота, заспамливая меня ахинеей и игнорируя мою отсылку на heartbleed. Это типично для балабола.

~~vcerloman~~
(21.02.18 15:34:18 MSK)

Ответ на: комментарий от vcerloman 21.02.18 15:34:18 MSK

Ему рассказали о том, что из сети берутся не только данные, но и их длина

Да уж...

anonymous
(21.02.18 15:47:34 MSK)

Похожие темы