K&R C Вопрос

Да, должно зависеть. Это не плюсы и [ i ] лишь «сахар» над адресной арифметикой.

~~Stahl~~ ★★☆
(07.04.15 13:37:18 MSK)
Последнее исправление: Stahl 07.04.15 13:37:59 MSK (всего исправлений: 1)

Не зависит.

kim-roader ★★
(07.04.15 13:40:05 MSK)

Ответ на: комментарий от Stahl 07.04.15 13:37:18 MSK

Ага значит недаром я взялся классику перечитывать :D

Интуиция еще не иссякла.

~~Twissel~~ ★★★★★
(07.04.15 13:40:50 MSK) автор топика

Ответ на: комментарий от kim-roader 07.04.15 13:40:05 MSK

Аргументы, пжалуста!

~~Twissel~~ ★★★★★
(07.04.15 13:41:29 MSK) автор топика

Нет.

~~Eddy_Em~~ ☆☆☆☆☆
(07.04.15 13:41:33 MSK)

Ответ на: комментарий от Twissel 07.04.15 13:40:50 MSK

Ты не спеши. Сейчас тут такой срач разведётся, что все мы 3 раза поменяем свою точку зрения и сойдёмся на том, что Ельцин это сплав жёлтого и бобра.

~~Stahl~~ ★★☆
(07.04.15 13:42:35 MSK)

Не зависит.

post-factum ★★★★★
(07.04.15 13:42:52 MSK)

Ссылка

Ответ на: комментарий от Twissel 07.04.15 13:41:29 MSK

Порядок байт в char* от "конечности" не зависит! Вот если ты будешь разбирать побайтно какую-нибудь uint64_t, то здесь тебе нужно на конечность системы ориентироваться.

И да, даже если бы какая-то извращенная система имела конечнозависимый порядок символов в char*, тебе все равно было бы на это насрать, т.к. write выводит их в таком же порядке, как пишет read. Ну и как ты заполняешь.

~~Eddy_Em~~ ☆☆☆☆☆
(07.04.15 13:43:36 MSK)

Ответ на: комментарий от Stahl 07.04.15 13:42:35 MSK

Не знаю, я думал, что здешние погромисты классику зачитали до дыр.

В отличии от меня

~~Twissel~~ ★★★★★
(07.04.15 13:44:57 MSK) автор топика

Ссылка

Ответ на: комментарий от Eddy_Em 07.04.15 13:41:33 MSK

Откуда взялся s? Вот в чём вопрос. Если он заполнялся аналогичным образом побайтово, то и разницы никакой нет. Мы знаем какой байт-литера на какой позиции. И железо тут ничего менять без нашего ведома не будет.

~~Stahl~~ ★★☆
(07.04.15 13:45:17 MSK)
Последнее исправление: Stahl 07.04.15 13:46:05 MSK (всего исправлений: 1)

Кстати, прикинь: я больше года думал, что мои STM32 тупоконечные, пока не наткнулся в RM о том, что они — тоже остроконечные! (правда, в некоторых более крутых моделях можно системными регистрами конечность менять).

Вот что значит — не использовать бинарную передачу данных! Воистину, в таких случаях сериализация рулез форева!

~~Eddy_Em~~ ☆☆☆☆☆
(07.04.15 13:45:35 MSK)

Ссылка

Ответ на: комментарий от Stahl 07.04.15 13:45:17 MSK

Тебе должно быть безразлично, откуда он взялся. Поверь мне, и на остроконечных, и на тупоконечных машинах этот код будет работать одинаково. И он одинаково паршив везде. Если ты не для микроконтроллера пишешь, то забудь про atoi, пользуйся strtoll.

~~Eddy_Em~~ ☆☆☆☆☆
(07.04.15 13:47:03 MSK)

Ответ на: комментарий от Twissel 07.04.15 13:41:29 MSK

«Порядок байт» относится к многобайтным типам данных. char[] это массив однобайтных. Нумерация символов в нём происходит естественным образом также как при чтении.

kim-roader ★★
(07.04.15 13:48:38 MSK)

Ссылка

Нет. Но код опирается на то что цифры от 0 до 9 следуют в кодировке по порядку.

PolarFox ★★★★★
(07.04.15 13:48:50 MSK)

Ответ на: комментарий от Eddy_Em 07.04.15 13:43:36 MSK

В char* не зависит, безусловно.

В том и вопрос, в каком порядке наша функция запихнет разряды числа в нужные адреса.

Или я не понимаю специфики работы кода?

~~Twissel~~ ★★★★★
(07.04.15 13:48:58 MSK) автор топика

Ответ на: комментарий от Twissel 07.04.15 13:48:58 MSK

Она запихнет их в правильном порядке, т.к. самым первым символом в char* будет старший разряд.

~~Eddy_Em~~ ☆☆☆☆☆
(07.04.15 13:50:20 MSK)

Ссылка

Ответ на: комментарий от PolarFox 07.04.15 13:48:50 MSK

А где ты видел кодировку, в которой первая половина не совпадает с ASCII?

~~Eddy_Em~~ ☆☆☆☆☆
(07.04.15 13:50:55 MSK)

Ответ на: комментарий от Eddy_Em 07.04.15 13:47:03 MSK

ЭТОТ код да, тут ломаться нечему. Если s придёт в правильной последовательности, то всё ок. Но вопрос, как мне кажется, был в другом: вот есть реализация atoi и можно ли её такую использовать в любом случае.
Никто же не гарантирует, что заполнение массива будет по байтам? Может там словами считывается, а потом уже приводится всё к char*. И в таком случае мы получим беду-беду-огорчение.

~~Stahl~~ ★★☆
(07.04.15 13:51:18 MSK)

Ответ на: комментарий от Stahl 07.04.15 13:51:18 MSK

Эм. Ты хочешь сказать, что если пользователь даст функции какую-то фигню, вместо строки с числом, то функция не запустит предсказатель из libastral.so?

kim-roader ★★
(07.04.15 13:53:45 MSK)

Ответ на: комментарий от Eddy_Em 07.04.15 13:50:55 MSK

EBCDIC например. Хотя цифры там тоже компактно и по порядку.

PolarFox ★★★★★
(07.04.15 13:55:04 MSK)

Ссылка

Ответ на: комментарий от kim-roader 07.04.15 13:53:45 MSK

А ты видишь тут где-то вызов void* do_it_good(void*)? :)

~~Stahl~~ ★★☆
(07.04.15 13:55:33 MSK)

Ответ на: комментарий от Stahl 07.04.15 13:55:33 MSK

Вот и я говорю, что его там нет. Так зачем ты придумываешь случай, когда переданный char* ссылается на что-то отличное от строки с числом?

kim-roader ★★
(07.04.15 14:00:18 MSK)

Ответ на: комментарий от Stahl 07.04.15 13:51:18 MSK

Никто же не гарантирует, что заполнение массива будет по байтам?

Архитектура гарантирует. Если заполнение массива будет не по байтам (а, скажем, с выравниванием на 64 бита), то и твой код будет с таким же выравниванием брать индексы!

~~Eddy_Em~~ ☆☆☆☆☆
(07.04.15 14:00:38 MSK)

Ответ на: комментарий от kim-roader 07.04.15 14:00:18 MSK

Потому что s, вероятней всего, просто сраный буфер, куда считывается строка. Если запить туда идёт не по 1 байту, то возможны варианты.
Это вполне логичный и распространённый вариант. Нахрена читать по байту если есть возможность читать словами?
Но если отталкиваться только от кода, который приведён и принять за данность, что содержимое s в очевидном порядке, то у меня возражений нет — код будет работать на любой машине одинаковым образом.

~~Stahl~~ ★★☆
(07.04.15 14:04:34 MSK)

Ответ на: комментарий от Eddy_Em 07.04.15 14:00:38 MSK

Удивительно. Но Эдик в этом топике выглядит самым адекватным.

Все верно он говорит. Одинаково этот код будет везде работать.

anonymous
(07.04.15 14:06:05 MSK)

Ссылка

Ответ на: комментарий от Stahl 07.04.15 14:04:34 MSK

Нахрена читать по байту если есть возможность читать словами?

А что, есть вариант, когда read(fd, uint64_t, 8) считает тебе в буфер не в том порядке, как оно на диске было, а задом-наперед? Это как?

~~Eddy_Em~~ ☆☆☆☆☆
(07.04.15 14:07:04 MSK)

Ответ на: комментарий от Eddy_Em 07.04.15 14:00:38 MSK

Выделили память.
Прочитали int.
Записали его в эту память.
Дальше приводим это к char* и работаем как со строкой.
Что тут архитектура будет гарантировать? Никто тут не вмешается.

~~Stahl~~ ★★☆
(07.04.15 14:07:19 MSK)

Ответ на: комментарий от Eddy_Em 07.04.15 14:00:38 MSK

Да, действительно.

~~Twissel~~ ★★★★★
(07.04.15 14:07:31 MSK) автор топика

Ссылка

Ответ на: комментарий от Stahl 07.04.15 14:07:19 MSK

Что тут архитектура будет гарантировать?

Она будет гарантировать, что порядок байт будет тем же самым. Иначе ты на этом говне вообще работать не сможешь, т.к. вместо 0xaabb прочитаешь 0xbbaa.

Другое дело — что в самом int уже порядок байт может иметь разное значение. Но тебя в данном случае это никак не касается!

~~Eddy_Em~~ ☆☆☆☆☆
(07.04.15 14:11:05 MSK)

Ссылка

Ответ на: комментарий от Eddy_Em 07.04.15 14:07:04 MSK

Хм. Ну ты прав в том, что, как ни крути, но именно строка не возьмётся откуда-то покорёженной. Даже если она будет генерироваться на лету в коде, сложно предположить, что она будет создаваться не побайтно.
Ок. Молчу.

~~Stahl~~ ★★☆
(07.04.15 14:12:12 MSK)

Ссылка

Пока дело отдельных байтов (или пересылки по сети мультибайтных значений) не касается, то зависить нечему.

beastie ★★★★★
(07.04.15 14:52:09 MSK)

Хорошо, т.е. вся суть в том, что char* обрабатывается напрямую — побайтно.

И меняться тут просто нечему, так?

~~Twissel~~ ★★★★★
(07.04.15 16:15:22 MSK) автор топика

Ссылка

Ответ на: комментарий от beastie 07.04.15 14:52:09 MSK

А я-то думал, что network byte order везде один :3 Два слова htons() и htonl()
P.S. Обожаю треды про Си, сколько радости они приносят! Какие страсти, какие драмы! Добра всем ИТТ.

~~fero~~ ★★★★
(07.04.15 16:16:16 MSK)
Последнее исправление: fero 07.04.15 16:18:37 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Stahl 07.04.15 13:51:18 MSK

Ещё раз, ты понимаешь что такое строка? Строка - это кусок адресспейса, где min начало, а max конец. Это определено, что строка читается вверх по адресам, как и любая память. Вся память выделяется вверх - это тоже определено.

Никто же не гарантирует, что заполнение массива будет по байтам?

Ты понимаешь что такое вообще этот порядок байт? Это представление данных в регистре(битиков), а не в памяти.

Он никогда не поменяется что бы ты не делал и как бэ ты не читал/писал. Пока ты работаешь с байтами, а поменять его может только работа с битиками.

Может там словами считывается, а потом уже приводится всё к char*

И? Какая разница как это считается - считывается память в регистр так же, как и кладётся обратно.

Вот иди возми 12кубиков и беря по 4 и кладя по 4 в том порядку, в котором взял и кладя туда, откуда взял попробуй сделать «биду-пичаль».

~~TrueTsar1C~~
(07.04.15 16:17:01 MSK)

Ответ на: комментарий от beastie 07.04.15 14:52:09 MSK

Пока дело отдельных байтов

Эти эксперты, эти эксперты.

Пока дело отдельных байтов МУЛЬТИБАЙТНЫХ ЗНАЧЕНИЙ

Вот наслушаются пацаны таких экспертов, а потом бида-пичаль у пацанов случается.

~~TrueTsar1C~~
(07.04.15 16:19:30 MSK)

Я то думал, что вопрос тупым-тупой, а в треде даже Царь отметился, гы :-)

~~Twissel~~ ★★★★★
(07.04.15 16:25:27 MSK) автор топика

Ответ на: комментарий от Twissel 07.04.15 16:25:27 MSK

Видно кто-то из палаты выпустил и сюда внес.

anonymous
(07.04.15 16:26:45 MSK)

Ссылка

Ответ на: комментарий от TrueTsar1C 07.04.15 16:17:01 MSK

Ну да, пока не перемешаем сами кубики, а не куски по четыре кубика, беды-печали нам не видать :-)

~~Twissel~~ ★★★★★
(07.04.15 16:27:39 MSK) автор топика

Ответ на: комментарий от TrueTsar1C 07.04.15 16:17:01 MSK

Кстати, я тебе задачу придумал. Нужную и сложную, но с простым описанием. Ещё ищешь?

i-rinat ★★★★★
(07.04.15 16:31:42 MSK)

дурик чтоле? причем тут порядок байт? ты битовые операции руками не выполняешь и строку с другой железяки/из сети не вытаскиваешь

</thread>

вброс хитер, но уныл

anonymous
(07.04.15 16:38:27 MSK)

Ответ на: комментарий от TrueTsar1C 07.04.15 16:19:30 MSK

уйди, болезный, не похож ты на царя, не похож

anonymous
(07.04.15 16:44:26 MSK)

Ссылка

Ответ на: комментарий от i-rinat 07.04.15 16:31:42 MSK

Пиши-пиши, я всегда ищу.

Я тут уже подписался на коечто, но тут нас ждут ещё месяцы общения с пациентом во имя понимания и захвата мира.

~~TrueTsar1C~~
(07.04.15 16:50:49 MSK)

Ответ на: комментарий от anonymous 07.04.15 16:38:27 MSK

вброс хитер, но уныл

Да не вброс это, я просто не подумал.

И, действительно, Царь правильно сказал нехорошо путать память с регистрами ЦП.

~~Twissel~~ ★★★★★
(07.04.15 16:51:36 MSK) автор топика

Ссылка

Ответ на: комментарий от TrueTsar1C 07.04.15 16:50:49 MSK

Нужно доработать (но там по сути — написать заново) sub filter модуль для nginx так, чтобы новая версия умела заменять сразу несколько шаблонов за один проход. С деградацией по скорости в зависимости от числа шаблонов примерно как у Ахо-Корасик или лучше.

i-rinat ★★★★★
(07.04.15 16:57:13 MSK)

Ответ на: комментарий от Twissel 07.04.15 16:27:39 MSK

Ну да, пока не перемешаем сами кубики, а не куски по четыре кубика, беды-печали нам не видать :-)

Её никогда не видать.

Вот ты берёшь 4кубика - это твой новый кубик, который теряет свои границы и расширяется до 4-х. Если ты будешь от него брать части - всё будет тоже самое.

А вот порядок байт - это не порядок байт, а интерпритация начала этого кубика твоим процессором. Т.е. с какой стороны у него первый байт, а с какой 2-й.

Это влияет только на то, когда ты манипулируешь с регистром - т.е. битопы, и самое основное - это формат чисел.

Если ты сделаешь int i = 0xaabbccdd; char * ip = &i; *ip = это будет всегда первый, т.е. младший по адресам байт. Т.е. один и тот же везде.

А вот значение разное и уже что там будет aa|dd или ещё что-то уже зависит какраз от того как как проецирует байты числа процессор на регистр. 0123 3210, либо ещё как - это уже порядок.

Байты не путаются, байты никуда не деются. Возникает лишь проблема с интерпритацией слов/мультибайтов на процессорах с разным порядком байт.

А представление байта везде одинаковое, а строка это байты, поэтому на строку повлиять никак нельзя.

~~TrueTsar1C~~
(07.04.15 17:13:25 MSK)

Ответ на: комментарий от TrueTsar1C 07.04.15 17:13:25 MSK

В общем и целом понял, спасибо.

Порядок байт это вопрос интерпретации этих байт на ЦП определенной архитектуры.

И к коду в топике он никаким боком относиться не может.

~~Twissel~~ ★★★★★
(07.04.15 17:23:12 MSK) автор топика

Ссылка

Ответ на: комментарий от i-rinat 07.04.15 16:57:13 MSK

чтобы новая версия умела заменять сразу несколько шаблонов за один проход.

Что значит заменять? Типа a->b, c->d, e->f или a,c,e->b?

С деградацией по скорости в зависимости от числа шаблонов примерно как у Ахо-Корасик или лучше.

И как это должно юзаться - приведи пример.

location / {
    sub_filter      </head>
        '</head><script language="javascript" src="$script"></script>';//как?
    sub_filter_once on;
}

~~TrueTsar1C~~
(07.04.15 17:35:03 MSK)

Ответ на: комментарий от TrueTsar1C 07.04.15 17:35:03 MSK

Что значит заменять? Типа a->b, c->d, e->f или a,c,e->b?

Для каждого шаблона задаётся отдельная строка. Второй вариант у тебя — это просто частный случай первого.

И как это должно юзаться - приведи пример.

Например, несколькими директивами sub_filter:

location / {
    sub_filter 'Lorem' 'ipsum';
    sub_filter 'dolor' 'sit';
    sub_filter 'amet' 'consectetur';
    sub_filter 'adipiscing' 'elit';
    sub_filter 'Duis' 'condimentum';
    sub_filter 'est' 'quis';
    sub_filter 'velit' 'tincidunt';
    sub_filter 'vehicula' 'Fusce';
    sub_filter 'velit' 'erat';
    sub_filter 'efficitur' 'a';
    sub_filter 'neque' 'at';
    sub_filter 'egestas' 'tempor';
    sub_filter 'odio' 'Duis';
    sub_filter 'facilisis' 'orci';
    sub_filter 'nec' 'fermentum';
    sub_filter 'sollicitudin' 'nibh';
    sub_filter 'neque' 'lobortis';
    sub_filter 'leo' 'ut';
    sub_filter 'gravida' 'quam';
    sub_filter 'risus' 'eget';

    sub_filter_once off;
}

Считай, что их там порядка трёх сотен, может тысяч.

i-rinat ★★★★★
(07.04.15 17:50:42 MSK)

Ответ на: комментарий от i-rinat 07.04.15 17:50:42 MSK

Хорошо.

Считай, что их там порядка трёх сотен, может тысяч.

А выкати это куда-то и примеры того, в чем это ищется для бенчмарков.

~~TrueTsar1C~~
(07.04.15 17:55:59 MSK)

Да.

Что-то меня сегодня накрыло, странно.

~~Twissel~~ ★★★★★
(07.04.15 17:57:29 MSK) автор топика

Ссылка

Похожие темы