Как в макросах переносимо определить порядок байт в слове на машине?

Пусть тебе система сборки задаёт макрос, по-моему, это проще. На чистых макросах ты максимум, что можешь получить — динамическую проверку во время исполнения

XMs ★★★★★
(21.08.17 15:54:35 MSK)

Ссылка

Ты не считаешь необходимым указать компилятор? Или так чтоб прям на всех было разом?

I-Love-Microsoft ★★★★★
(21.08.17 15:59:04 MSK)

Макросы на это не способны, нет вычисления, которое даст разные результаты. Компиляторы выставляют специфичные макросы, системы сборки, как подсказывают, могут использовать их или знание о целевой архитектуре.

xaizek ★★★★★
(21.08.17 16:00:01 MSK)

Ссылка

Ответ на: комментарий от I-Love-Microsoft 21.08.17 15:59:04 MSK

На всех POSIX.

normann ★★★
(21.08.17 16:00:08 MSK) автор топика

Ответ на: комментарий от normann 21.08.17 16:00:08 MSK

Это уже другое дело (включая заднеприводные оси?), стало быть форточная тема отвядает.

I-Love-Microsoft ★★★★★
(21.08.17 16:03:03 MSK)

Есть «arpa/inet.h» (htonl() и т.п.), но в мануале по этим макросам написано что какие нибудь реализации могут требовать вместо «arpa/inet.h» - «netinet/inet.h». Может быть это можно как-то отследить в макросах?

normann ★★★
(21.08.17 16:03:46 MSK) автор топика

Ссылка

Ответ на: комментарий от I-Love-Microsoft 21.08.17 16:03:03 MSK

Да. Так есть решение?

normann ★★★
(21.08.17 16:04:16 MSK) автор топика

Ответ на: комментарий от normann 21.08.17 16:04:16 MSK

Посмотри как в бусте сделано

http://www.boost.org/doc/libs/1_43_0/boost/detail/endian.hpp

Dark_SavanT ★★★★★
(21.08.17 16:06:04 MSK)

У меня так. И я реально работаю с процессорами с разным порядком.

#pragma once

#ifdef MATLAB_MEX_FILE
#   define INTEL_ORDER 1
#endif

#ifdef __LITTLE_ENDIAN__
#if __LITTLE_ENDIAN__ == 1
#   define INTEL_ORDER 1
#endif
#endif

#ifdef __BIG_ENDIAN__
#if __BIG_ENDIAN__ == 1
#   define MOTOROLA_ORDER 1
#endif
#endif

#ifdef __little_endian__
#if __little_endian__ == 1
#   define INTEL_ORDER 1
#endif
#endif

#if __big_endian__ == 1
#   define MOTOROLA_ORDER 1
#endif

#if defined (__BYTE_ORDER__)
#   if __BYTE_ORDER__ == __ORDER_LITTLE_ENDIAN__
#       define INTEL_ORDER 1
#   endif
#   if __BYTE_ORDER__ == __ORDER_BIG_ENDIAN__
#       define MOTOROLA_ORDER 1
#   endif
#endif

#if defined (__GLIBC__)
#   include <endian.h>
#   if __BYTE_ORDER__ == __ORDER_LITTLE_ENDIAN
#       define INTEL_ORDER 1
#   endif
#   if __BYTE_ORDER__ == __ORDER_BIG_ENDIAN
#       define MOTOROLA_ORDER 1
#   endif
#endif

#if  !defined(INTEL_ORDER) && !defined(MOTOROLA_ORDER)
#error "Unknow bit order"
#endif

#if defined(INTEL_ORDER)
#define ENDIANLES "LE"
#else
#define ENDIANLES "BE"
#endif

vromanov ★★★
(21.08.17 17:09:46 MSK)
Последнее исправление: vromanov 21.08.17 17:10:55 MSK (всего исправлений: 1)

Ссылка

Правильно — никак. Тебя не должен волновать порядок байт на локальной машие.

ref: https://commandcenter.blogspot.de/2012/04/byte-order-fallacy.html

beastie ★★★★★
(21.08.17 17:14:35 MSK)

Если «переносимо» — в рамках gcc, clang и систем мимикирующих под них, то

__BYTE_ORDER__
__ORDER_LITTLE_ENDIAN__
__ORDER_BIG_ENDIAN__
__ORDER_PDP_ENDIAN__

    __BYTE_ORDER__ is defined to one of the values __ORDER_LITTLE_ENDIAN__, __ORDER_BIG_ENDIAN__, or __ORDER_PDP_ENDIAN__ to reflect the layout of multi-byte and multi-word quantities in memory. If __BYTE_ORDER__ is equal to __ORDER_LITTLE_ENDIAN__ or __ORDER_BIG_ENDIAN__, then multi-byte and multi-word quantities are laid out identically: the byte (word) at the lowest address is the least significant or most significant byte (word) of the quantity, respectively. If __BYTE_ORDER__ is equal to __ORDER_PDP_ENDIAN__, then bytes in 16-bit words are laid out in a little-endian fashion, whereas the 16-bit subwords of a 32-bit quantity are laid out in big-endian fashion.

    You should use these macros for testing like this:

    /* Test for a little-endian machine */
    #if __BYTE_ORDER__ == __ORDER_LITTLE_ENDIAN__

источник.
Ну и как уже сказали выше — по нормальному надо писать код которому всё равно на порядок байт хост-машины.

Deleted
(21.08.17 17:34:30 MSK)

Ссылка

Ответ на: комментарий от beastie 21.08.17 17:14:35 MSK

А если структуру надо прочитать из сырых данных, а там другой порядок байт?

Aswed ★★★★★
(21.08.17 17:38:31 MSK)

Ответ на: комментарий от beastie 21.08.17 17:14:35 MSK

Тебя не должен волновать порядок байт на локальной машие.

Он меня не может не волновать, например если я пишу код для работы с протоколом ModBus (обмена по проводу), где слова надо формировать в «сетевом» порядке.

normann ★★★
(21.08.17 17:44:06 MSK) автор топика
Последнее исправление: normann 21.08.17 17:46:03 MSK (всего исправлений: 1)

Ответ на: комментарий от Dark_SavanT 21.08.17 16:06:04 MSK

Посмотри как в бусте сделано

http://www.boost.org/doc/libs/1_43_0/boost/detail/endian.hpp

Спасибо, подглядел и вдохновился оттуда.

normann ★★★
(21.08.17 17:45:01 MSK) автор топика

Ссылка

Ответ на: комментарий от normann 21.08.17 17:44:06 MSK

И? Зачем тебе для этого знать локальный порядок байт?

LE data:

i = (data[3]<<0) | (data[2]<<8) | (data[1]<<16) | (data[0]<<24);

BE data:

i = (data[0]<<0) | (data[1]<<8) | (data[2]<<16) | (data[3]<<24);

При этом это корректно работает независимо от порядка байт i.

beastie ★★★★★
(21.08.17 17:51:15 MSK)

Ответ на: комментарий от normann 21.08.17 17:44:06 MSK

Всё, что тебе надо знать — это две функции: htonl и ntohl.

beastie ★★★★★
(21.08.17 17:52:11 MSK)

Ссылка

Ответ на: комментарий от beastie 21.08.17 17:51:15 MSK

Это не будет работать одинаково на машинах с разным порядком байт.

normann ★★★
(21.08.17 17:59:32 MSK) автор топика

Ответ на: комментарий от normann 21.08.17 17:59:32 MSK

O_RLY? Prove it!

beastie ★★★★★
(21.08.17 18:00:01 MSK)

Ответ на: комментарий от beastie 21.08.17 18:00:01 MSK

Разберись со своим приведенным кодом, первая строчка ВСЕГДА будет менять порядок на отличный от машины, а вторая строчка вообще ошибка.

normann ★★★
(21.08.17 18:05:48 MSK) автор топика
Последнее исправление: normann 21.08.17 18:06:09 MSK (всего исправлений: 1)

Ответ на: комментарий от normann 21.08.17 18:05:48 MSK

первая строчка ВСЕГДА будет менять порядок на отличный от машины

Как это? Ну да, он перепутал LE и BE. Но в остальном должно быть нормально.

i-rinat ★★★★★
(21.08.17 18:21:18 MSK)

Ссылка

Ответ на: комментарий от normann 21.08.17 18:05:48 MSK

Вчитайся ещё раз. Мы оперируем в контексте int.

i << 8 работает на любой машине одинаково.

beastie ★★★★★
(21.08.17 18:27:17 MSK)

Здесь описан способ как определить: https://ru.wikipedia.org/wiki/Порядок_байтов

neon1ks ★★
(21.08.17 19:06:11 MSK)

Ссылка

Ответ на: комментарий от normann 21.08.17 18:05:48 MSK

А htonl с ntohl чем не угодили?

Softwayer ★★
(21.08.17 19:19:32 MSK)

Ссылка

Ответ на: комментарий от beastie 21.08.17 18:27:17 MSK

Работает одинаково. Но в зависимости от системы, записывается по разному.

i = | 00000000 | 10000000 | 00000000 | 00000000 |
i = i << 1

В Little-Endian и Big-Endian чему будет ровняться i ?

neon1ks ★★
(21.08.17 19:23:44 MSK)

Ответ на: комментарий от neon1ks 21.08.17 19:23:44 MSK

Некорректная постановка вопроса. Куда записываются? То, что данные при записи на (локальный) диск тоже тоже надо маршилизировать, надеюсь ты слышишь не в первый раз.

Без разницы, от куда данные — с диска ли или из сети, для них есть формат. Из этого формата ты читаешь и дальше endianness тебя не волнует.

beastie ★★★★★
(21.08.17 19:35:29 MSK)

Ответ на: комментарий от beastie 21.08.17 19:35:29 MSK

В оперативной памяти или в стеке.

В Little-Endian

i = | 00000001 | 00000000 | 00000000 | 00000000 |

В Big-Endian

i = | 00000000 | 00000000 | 00000001 | 00000000 |

Есть реализация функции htonll https://www.viva64.com/ru/k/0018/

там можно подсмотреть определение порядка байтов. Принцип в принципе один и тот же)

neon1ks ★★
(21.08.17 19:40:46 MSK)
Последнее исправление: neon1ks 21.08.17 19:44:15 MSK (всего исправлений: 1)

Ответ на: комментарий от normann 21.08.17 17:44:06 MSK

Он меня не может не волновать, например если я пишу код для работы с протоколом ModBus (обмена по проводу), где слова надо формировать в «сетевом» порядке.

Скоро тебя ждёт удивительное открытие: различные дейвайсы плевать хотели на принятый в модбасе порядок. Так что сразу готовься переставлять слова (для смешанного) и байты. И это должна быть настройка индивидуальная для регистра, а не опция компиляции!

Для примера можешь глянуть спек на какой-нибудь немецкий девайс с модбасом. Немцы любят пихать кастомные типы и играть с порядком байт (на одном устройстве!).

anonymous
(21.08.17 19:49:12 MSK)

Ссылка

Ответ на: комментарий от neon1ks 21.08.17 19:40:46 MSK

Ты не понял главного. Ты не оперируешь с int на битовом уровне. Если ты это делаешь, ты делаешь что-то не правильно.

Что на BE машине 42>>1 == 21, что на LE машине. Грязные делишки CPU, что и как конкретно делает с int — никого не волнуют.

TL;DR: пример — достать 13 байт из int:

Правильный, портабельный метод, независимый от endianness:

bit = (i >> 13) & 1

Неправильный, ССЗБ метод, зависящий от endianness:

union {
  int  i;
  char c[4];
} x;
x.i = 42;
bit = (x.c[1] & 0x20) != 0;

beastie ★★★★★
(21.08.17 20:16:24 MSK)

Ответ на: комментарий от Aswed 21.08.17 17:38:31 MSK

Нормальные люди при записи сериализуют данные, а при чтении десериализуют. Простые типы при этом пишутся в т. н. сетевом порядке, что исключает описанную тобой проблему

XMs ★★★★★
(21.08.17 20:54:07 MSK)

Ответ на: комментарий от XMs 21.08.17 20:54:07 MSK

А если человек какой-нибудь **_api.h пишет и там что-то вроде

/* stat mode_t wrapper type */
typedef union fmode_u {
    struct{
#if defined (BUILD_LITTLE_ENDIAN)
        unsigned arwx:3;
        unsigned grwx:3;
        unsigned urwx:3;
        unsigned vtx:1;
        unsigned gid:1;
        unsigned uid:1;
        unsigned type:4;
        uint16_t stub;
#elif defined(BUILD_BIG_ENDIAN)
        uint16_t stub;
        unsigned type:4;
        unsigned uid:1;
        unsigned gid:1;
        unsigned vtx:1;
        unsigned urwx:3;
        unsigned grwx:3;
        unsigned arwx:3;
#else
    #error Build with this endianess not realised
#endif
    }fields;
    uint32_t data;
} fmode_t;

.. до зарезу нужно, то как тогда выкручиваться нормальным людям?

SkyMaverick ★★★★★
(21.08.17 22:28:38 MSK)
Последнее исправление: SkyMaverick 21.08.17 22:31:56 MSK (всего исправлений: 1)

С c++20 стандарт енум даст: http://en.cppreference.com/w/cpp/types/endian

zamazan4ik ★★
(21.08.17 22:30:22 MSK)

Ссылка

Ответ на: комментарий от SkyMaverick 21.08.17 22:28:38 MSK

Писать сериализатор и десериализатор этого юниона, для разных архитектур свой. Запись и чтение будут происходить в Big-Endian, ибо network byte order, а дальше уже будет использоваться нативный порядок байт

XMs ★★★★★
(21.08.17 23:13:06 MSK)

Ссылка

Ответ на: комментарий от beastie 21.08.17 17:14:35 MSK

нет, таки в некоторых местах это очень важно. хотя бы для того, чтобы читать данные из сети и правильно их интерпретировать. но обычно это определяется на этапе компиляции, из макросов, определённых в компиляторе и при использовании стандартных макросов проблемы не возникает.

Iron_Bug ★★★★★
(21.08.17 23:27:25 MSK)

c++
переносимо

http://www.boost.org/doc/libs/1_65_0/libs/endian/doc/index.html

Макросы и остальное - ХЗ.

asaw ★★★★★
(22.08.17 01:21:19 MSK)

Ссылка

Обычно, это делается на этапе компиляции с помощью системы сборки. Чтобы не таскать свои велосипеды по проектам. Смотри в сторону CMake. Все остальное, что тебе тут наговорили - велосипеды.

MuZHiK-2 ★★★★
(22.08.17 01:24:57 MSK)

Ссылка

Ответ на: комментарий от Iron_Bug 21.08.17 23:27:25 MSK

Для чтения и интерпретации байтиков из сети ПОРЯДОК БАЙТ НА ЛОКАЛЬНОЙ МАШИНЕ НЕ ВАЖЕН.

Как уже неоднократно тут пытается сказать beastie.

anonymous
(22.08.17 01:45:13 MSK)

Ответ на: комментарий от Iron_Bug 21.08.17 23:27:25 MSK

нет, таки в некоторых местах это очень важно. хотя бы для того, чтобы читать данные из сети и правильно их интерпретировать. но обычно это определяется на этапе компиляции, из макросов, определённых в компиляторе и при использовании стандартных макросов проблемы не возникает.

Что прямо вот реально пишешь #ifdef __LITTLE_ENDIAN__ и #ifdef __BIG_ENDIAN__ вместо того, чтобы заюзать ntohl()? Ну и изврат...

i-rinat ★★★★★
(22.08.17 01:54:27 MSK)

Если макросами, то так: http://www.boost.org/doc/libs/1_65_0/doc/html/predef/reference.html#predef.re...

NikolaSh
(22.08.17 04:29:10 MSK)

Ссылка

Ответ на: комментарий от i-rinat 22.08.17 01:54:27 MSK

ntohl - часть стандартной позиксовской библиотеки. и она зависит от платформы. хотя позикс может быть не везде, ага.

и таки иногда, если байтики упакованы вдруг не по 2-4 байта, а по 3 или 6, например, приходится вручную их переставлять. и тогда да, ifdef, макросы и вот это всё.

Iron_Bug ★★★★★
(22.08.17 07:29:39 MSK)
Последнее исправление: Iron_Bug 22.08.17 07:29:53 MSK (всего исправлений: 1)

Ответ на: комментарий от anonymous 22.08.17 01:45:13 MSK

ты хоть раз что-нибудь писал для сети? напиши - тогда расскажешь всем, как он «неважен».

Iron_Bug ★★★★★
(22.08.17 07:32:33 MSK)

Ответ на: комментарий от beastie 21.08.17 20:16:24 MSK

пример — достать 13 байт из int

Имелось ввиду бит?

~~Twissel~~ ★★★★★
(22.08.17 08:52:25 MSK)

Ссылка

Ответ на: комментарий от XMs 21.08.17 20:54:07 MSK

Ну офигеть теперь. А ты значит живешь в идеальном мире, где нет индусов и чужие структуры читать не надо, только свои и других замечательных программистов, которые всегда компилируют с первого раза.

Aswed ★★★★★
(22.08.17 09:11:21 MSK)

Ответ на: комментарий от Aswed 22.08.17 09:11:21 MSK

и чужие структуры читать не надо

Обычно для них уже есть десериализатор, если предполагается, что структура будет передаваться по сети либо читаться с диска. А даже если и нет, не так уж сложно его сделать. Для простых типов используем сетевой порядок при чтении и записи, битовые поля также пишем в Big-Endian, конвертируя, если надо

XMs ★★★★★
(22.08.17 09:53:07 MSK)

Ответ на: комментарий от XMs 22.08.17 09:53:07 MSK

С твоим подходом проще писать на жабе. И вообще - даешь чистый жабный процессор, чтобы никаких там бит и байт, а сразу объектами кидать по регистрам. Ну и конечно же встроенный в процессор мусоросборник.

anonymous
(22.08.17 10:59:05 MSK)

Ответ на: комментарий от Iron_Bug 22.08.17 07:29:39 MSK

varint же!

beastie ★★★★★
(22.08.17 11:03:56 MSK)

Ответ на: комментарий от anonymous 22.08.17 10:59:05 MSK

По-твоему, писать код, в основном не зависящий от архитектурных особенностей и обеспечивающий безболезненное сокрытие оных в местах, где без них никак — это плохо, и обеспечивать единые точки перехода не нужно, вместо этого на протяжении всего кода стоит держать эти особенности в памяти и обходить локально, я правильно тебя понимаю? Если да, то увы, не соглашусь — по мне такой подход чреват ошибками в куда большей степени

XMs ★★★★★
(22.08.17 11:18:11 MSK)

Ответ на: комментарий от beastie 21.08.17 17:51:15 MSK

царь не одобрит-с. ту мач инстракшнс

anonymous
(22.08.17 11:22:17 MSK)

Ответ на: комментарий от Iron_Bug 22.08.17 07:32:33 MSK

Прочти ссылку, которую привёл beastie. Вот ещё: https://www.reddit.com/r/programming/comments/rsl8o/rob_pike_code_that_asks_a...

anonymous
(22.08.17 11:42:07 MSK)

Ответ на: комментарий от anonymous 22.08.17 11:22:17 MSK

ту мач инстракшнс

На x86 такие выражения компилируются gcc в одну инструкцию (movl) для le и две инструкции (movl+bswap) для be.

i-rinat ★★★★★
(22.08.17 11:45:18 MSK)

Ссылка

Ответ на: комментарий от Iron_Bug 22.08.17 07:29:39 MSK

Понты прям так и прут. Ну продолжай делать за компилятор его работу.

i-rinat ★★★★★
(22.08.17 11:46:17 MSK)

Похожие темы