Преобразование bytes в число

0

3

Есть пример кода:

typedef union _TypeUn{
__int32 i;
unsigned char Byte[4];
} TypeUn;


void ConvertByteToInt(char * bytes, char * StrInt)
{
 TypeUn tc;
 char znak = ' ';
 tc.Byte[0] = bytes[0];
 tc.Byte[1] = bytes[1];
 tc.Byte[2] = bytes[2];
 tc.Byte[3] = bytes[3];

 int h,m,s,f;
 if( tc.i < 0 )
 {
   znak = '-';
   tc.i = abs(tc.i);
 }
 else
   znak = '+';

 tc.i >>= 2;

 ConvertToTime(tc.i,h,m,s,f);

 sprintf(StrInt,"%c%02d:%02d:%02d:%02d",znak,h,m,s,f);
}

Я не пойму как это работает - как из массива bytes получается целое число ?

Ссылка

←	Ну и почему оно не линкуется?

Приглашаю потестить новую версию QtWebKit

→

как из массива bytes получается целое число ?

union. Байты лежат на том же месте, где и int поле. Трюк с записью и чтением разных полей union работает в GCC, но по стандарту работать не обязан.

i-rinat ★★★★★
(30.05.16 19:44:33 MSK)

Ответ на: комментарий от i-rinat 30.05.16 19:44:33 MSK

но по стандарту работать не обязан.

Почему? Это же и есть то, для чего был создан union. Или я чего-то не знаю?

Kroz ★★★★★
(30.05.16 19:48:04 MSK)

Ответ на: комментарий от Kroz 30.05.16 19:48:04 MSK

Не просто не обязан, это undefiened bahavior.

Из union можно взять только то что туда положено (положили число, взять можно только число, байты трогать нельзя). union был создан ровно для этого (хранить объект одного из заданных типов без оверхеда), не для хаков с преобразованием типов бинарных данных.

slovazap ★★★★★
(30.05.16 19:58:41 MSK)
Последнее исправление: slovazap 30.05.16 19:59:47 MSK (всего исправлений: 1)

Ответ на: комментарий от slovazap 30.05.16 19:58:41 MSK

Кстати, может ты знаешь какой-нибудь способ преобразований не через memcpy?

i-rinat ★★★★★
(30.05.16 20:19:59 MSK)

Ответ на: комментарий от i-rinat 30.05.16 20:19:59 MSK

О каком преобразовании спрашиваете?

Трюк в сабже архитектурно-зависим. Зависит от endianness архитектуры. По-хорошему нужно юзать ntohl(), htonl() и т. п.

Andrey_Utkin ★★
(30.05.16 20:26:01 MSK)

Ответ на: комментарий от Andrey_Utkin 30.05.16 20:26:01 MSK

О каком преобразовании спрашиваете?

преобразовать что-то крупнее байт в байты и наоборот.

По-хорошему нужно юзать ntohl(), htonl() и т. п.

В glibc есть htobe32(), htole32(), htobe64() и обратные.

i-rinat ★★★★★
(30.05.16 20:37:16 MSK)

Ответ на: комментарий от i-rinat 30.05.16 20:37:16 MSK

int ble[4]={4,3,2,1};//{0,1,2,3};

long L=((B[ble[3]]*256+B[ble[2]])*256+B[ble[1]])*256+B[ble[0]];

anonymous
(30.05.16 20:55:18 MSK)

Ответ на: комментарий от anonymous 30.05.16 20:55:18 MSK

Для целочисленных подходит. Но для double, скорее всего, нет.

Upd. И ещё UB будет, если в знаковый бит залезть.

i-rinat ★★★★★
(30.05.16 20:57:00 MSK)
Последнее исправление: i-rinat 30.05.16 21:00:32 MSK (всего исправлений: 1)

Ответ на: комментарий от i-rinat 30.05.16 20:19:59 MSK

Сдвигами и логическими операциями.

slovazap ★★★★★
(30.05.16 20:57:10 MSK)

Ссылка

Ответ на: комментарий от i-rinat 30.05.16 20:37:16 MSK

В glibc есть htobe32(), htole32(), htobe64() и обратные.

И ещё много чего. И что?

Andrey_Utkin ★★
(30.05.16 21:07:42 MSK)

Ссылка

Ответ на: комментарий от i-rinat 30.05.16 20:57:00 MSK

Но для double, скорее всего, нет.

Так точно, не подходит.

ntohl(), htonl() - для лонгов, у ТС - int h,m,s,f; А нужны даблы?

(там надо складывать(раскусывать) битовыми & | << , у float не по границе байт)

anonymous
(30.05.16 21:08:55 MSK)

Ответ на: комментарий от anonymous 30.05.16 21:08:55 MSK

А нужны даблы?

Решил заодно спросить о проблеме вообще, то есть десериализация любого примитивного типа. Я знаю способ через memcpy. Но вдруг есть ещё способы?

i-rinat ★★★★★
(30.05.16 21:19:02 MSK)

Ответ на: комментарий от i-rinat 30.05.16 20:19:59 MSK

Если код собирается под кокретную архитектуру - то можно и union использовать. Или битовую арифметику, но с гранулярность не по биту, а покрупнее. (uint32_t)byte[0]<<24 | (uint32_t)byte[1]<<16 | (uint32_t)byte[2]<<8 | byte[3]

vromanov ★★★
(30.05.16 21:20:21 MSK)

Ответ на: комментарий от i-rinat 30.05.16 19:44:33 MSK

Гм спасибо. А мне надо эти цифры получать в python. Если я правильно понимаю нужно использовать вот это:

classmethod int.from_bytes(bytes, byteorder, *, signed=False)

    Return the integer represented by the given array of bytes.
    >>>

    >>> int.from_bytes(b'\x00\x10', byteorder='big')
    16
    >>> int.from_bytes(b'\x00\x10', byteorder='little')
    4096
    >>> int.from_bytes(b'\xfc\x00', byteorder='big', signed=True)
    -1024
    >>> int.from_bytes(b'\xfc\x00', byteorder='big', signed=False)
    64512
    >>> int.from_bytes([255, 0, 0], byteorder='big')
    16711680

Только вот какой вариант byteorder и signed ?

~~Jopich~~
(30.05.16 22:01:28 MSK) автор топика

Ответ на: комментарий от Jopich 30.05.16 22:01:28 MSK

Только вот какой вариант byteorder и signed ?

Какой нужно, такой и берёшь.

i-rinat ★★★★★
(30.05.16 22:05:12 MSK)

Ответ на: комментарий от vromanov 30.05.16 21:20:21 MSK

Если код собирается под кокретную архитектуру - то можно и union использовать

Никогда нельзя, это UB.

slovazap ★★★★★
(30.05.16 22:11:02 MSK)

Ответ на: комментарий от i-rinat 30.05.16 21:19:02 MSK

Если не в сеть (не надо подстраиваться под стандарт), то так:

#include <stdio.h>
#define N sizeof(double)
int main()
{
    double a = 0, b = 543.21;
    char s[N + 1];

    *((double *) s) = b;
    a = (*((double *) s));
    printf("%f %f\n", a, b);
    return 0;
}

N бывает разный: на atmega-x 32, не пентиумах >~10лет назад 48.

anonymous
(30.05.16 22:24:02 MSK)

Ответ на: комментарий от slovazap 30.05.16 22:11:02 MSK

Это UB стандарта C, но не конкретного компилятора и платформы. особенно при иcпользовании pragma pack и align

vromanov ★★★
(30.05.16 22:47:43 MSK)

Ответ на: комментарий от vromanov 30.05.16 22:47:43 MSK

UB - это всегда UB, запомните это раз и навсегда.

slovazap ★★★★★
(30.05.16 22:54:49 MSK)

Ответ на: комментарий от anonymous 30.05.16 22:24:02 MSK

N бывает разный: на atmega-x 32, не пентиумах >~10лет назад 48.

Поправочка: это в битах. Т.е. 32=4байта, 48=6байт.

anonymous
(30.05.16 23:06:35 MSK)

Ссылка

Ответ на: комментарий от slovazap 30.05.16 22:54:49 MSK

И где тут UB? Стандарт обещает, что поля union лежат по одному адресу. Поведение pragma pack также известно и детерминировано.

vromanov ★★★
(30.05.16 23:39:15 MSK)

Ответ на: комментарий от vromanov 30.05.16 23:39:15 MSK

И где тут UB?

Стандарт разрешает ровно один случай чтения из union не того что туда было записано

[Note: One special guarantee is made in order to simplify the use of unions: If a standard-layout union contains several standard-layout structs that share a common initial sequence (9.2), and if an object of this standard-layout union type contains one of the standard-layout structs, it is permitted to inspect the common initial sequence of any of standard-layout struct members; see 9.2. — end note]

Стандарт обещает, что поля union лежат по одному адресу

И что?

Поведение pragma pack также известно и детерминировано

Лол, pragma pack вообще в стандарт не входит.

slovazap ★★★★★
(31.05.16 00:06:30 MSK)

Ответ на: комментарий от i-rinat 30.05.16 21:19:02 MSK

__asm__ и поехали

deadNightTiger ★★★★★
(31.05.16 00:31:31 MSK)

Ссылка

Ответ на: комментарий от slovazap 30.05.16 19:58:41 MSK

union был создан ровно для этого (хранить объект одного из заданных типов без оверхеда)

4.2

Union был создан именно для того, что в ОП-посте. Но кросплатформенно это не описать, поэтому в стандарте этой логики нет и не будет.

LamerOk ★★★★★
(31.05.16 00:41:55 MSK)

Ответ на: комментарий от LamerOk 31.05.16 00:41:55 MSK

Какой бред. Ты же сам себе противоречишь.

slovazap ★★★★★
(31.05.16 00:49:08 MSK)

Ответ на: комментарий от slovazap 31.05.16 00:06:30 MSK

Стандарт разрешает ровно один случай чтения из union не того что туда было записано

6.5.2.3.3

95) If the member used to read the contents of a union object is not the same as the member last used to store a value in the object, the appropriate part of the object representation of the value is reinterpreted as an object representation in the new type as described in 6.2.6 (a process sometimes called ‘‘type punning’’). This might be a trap representation.

Laz ★★★★★
(31.05.16 08:41:22 MSK)

Ответ на: комментарий от slovazap 30.05.16 22:11:02 MSK

Никогда нельзя, это UB.

Ну, сделай барьер памяти на запись между записью одного типа и чтением другого и чтобы это UB стало действительно undefined создателям компилятора придется очень постараться. Ведь, если знаешь, как работает компилятор, то UB довольно прозрачная вещь (а если не знаешь, то что ты делаешь в профессии).

anonymous
(31.05.16 08:58:33 MSK)

Ответ на: комментарий от slovazap 30.05.16 22:54:49 MSK

UB - это всегда UB, запомните это раз и навсегда.

Только задротов-теоретиков. Практики делают стабильно работающий код на нужных архитектурах, остальные их не интересуют. Если какой-нибудь солярис студио по-своему откомпилирует код, который нормально работает под gcc и MsVc, то это трудности той платформы. А если кому-то из заказчиков упрется именно эта такая платформа, то он получит отдельный счет за ее поддержку и особые условия, после чего начнет думать более разумно.

P.S. Интересно, что ты будешь делать со своим фанатизмом, когда потребуется поддерживать платформу, которая не совсем соответствует стандартам... Потому что выбор будет «между сделать чтобы работало» и «сделать по стандарту».

anonymous
(31.05.16 09:05:36 MSK)

Ответ на: комментарий от vromanov 30.05.16 23:39:15 MSK

И где тут UB?

Компилятор может закешировать записываемое значение (т.е. не сохранять в память), а читать, что там сохранено. Может быть, конкретно в этом примере такое не возможно, но при записи и чтении из union, вполне может быть.

anonymous
(31.05.16 09:07:40 MSK)

Ссылка

int i;
unsigned char b[sizeof(i)];

memcpy(i,b,sizeof(i));

anonymous
(31.05.16 10:06:09 MSK)

Ответ на: комментарий от anonymous 31.05.16 09:05:36 MSK

Интересно, что ты будешь делать со своим фанатизмом

Это не фанатизм, а единственный разумный подход. А вы мало того что анонимус, так еще и говнокодер.

Deleted
(31.05.16 11:05:01 MSK)

Ссылка

Ответ на: комментарий от Laz 31.05.16 08:41:22 MSK

Это только в C, в С++ этого нет.

slovazap ★★★★★
(31.05.16 12:30:14 MSK)

Ответ на: комментарий от anonymous 31.05.16 09:05:36 MSK

Только задротов-теоретиков. Практики делают стабильно работающий код на нужных архитектурах, остальные их не интересуют. Если какой-нибудь солярис студио по-своему откомпилирует код, который нормально работает под gcc и MsVc, то это трудности той платформы.

Это надо в золотую рамку как эталон ламера. «Практики» такие у нас двор метут.

slovazap ★★★★★
(31.05.16 12:34:04 MSK)

Ссылка

Ответ на: комментарий от anonymous 31.05.16 09:05:36 MSK

А если кому-то из заказчиков упрется именно эта такая платформа, то он получит отдельный счет за ее поддержку и особые условия, после чего начнет думать более разумно.

И сменит исполнителя.

FeyFre ★★★★
(31.05.16 12:37:15 MSK)

Ссылка

Ответ на: комментарий от anonymous 31.05.16 10:06:09 MSK

Может так:

int i;
unsigned char b[sizeof(i)];

i=(*((int *)b));

Зачем вызов memcpy для мелких типов, известных компилятору ?

anonymous
(31.05.16 16:28:37 MSK)

Ответ на: комментарий от anonymous 31.05.16 16:28:37 MSK

Зачем вызов memcpy для мелких типов, известных компилятору?

Чтобы твой код гарантированно работал, нужно в ключи добавлять -fno-strict-aliasing.

i-rinat ★★★★★
(31.05.16 16:39:47 MSK)

Ответ на: комментарий от i-rinat 31.05.16 16:39:47 MSK

Не понял причину. Пересечение в памяти i и b или другая ? (Пересечение - фигня, т.к. укладка в i происходит за одну пересылку из регистра в память.)

anonymous
(31.05.16 17:00:38 MSK)

Ссылка

Ответ на: комментарий от anonymous 31.05.16 08:58:33 MSK

как работает компилятор

Завтра он начнёт работать «по-другому», туда всунут какую-нибудь оптимизацию, основанную на UB, — и всё.

https://habrahabr.ru/post/230777/

anonymous
(31.05.16 17:12:44 MSK)

Ссылка

Ответ на: комментарий от anonymous 30.05.16 21:08:55 MSK

(там надо складывать(раскусывать) битовыми & | << , у float не по границе байт)

qulinxao, зачем разлогинился?

anonymous
(31.05.16 17:13:42 MSK)

Ссылка

Ответ на: комментарий от slovazap 31.05.16 12:30:14 MSK

Код вполне сишный, а тег не увидел. Тогда полностью поддерживаю.

Laz ★★★★★
(31.05.16 22:11:27 MSK)

Ссылка

Ответ на: комментарий от i-rinat 30.05.16 19:44:33 MSK

tc.i >>= 2;

А что означает эта операция в C++ синтаксисе ?

~~Jopich~~
(01.06.16 19:33:26 MSK) автор топика

Ответ на: комментарий от Jopich 01.06.16 19:33:26 MSK

А что означает эта операция в C++ синтаксисе ?

Она означает tc.i = tc.i >> 2;, то есть сдвиг вправо. (Как и в питоне, кстати). Если поле i имеет тип со знаком, и там лежит отрицательное число, операция implementation-defined.

i-rinat ★★★★★
(01.06.16 19:44:13 MSK)

Ссылка

Ответ на: комментарий от i-rinat 30.05.16 22:05:12 MSK

О подобрал.

int.from_bytes(line, byteorder="little",signed=True) >> 2

Остался вопрос: byteorder, signed - это определяется на уровне как данное число занесено в бинарный формат ?

~~Jopich~~
(01.06.16 19:57:01 MSK) автор топика

Ответ на: комментарий от Jopich 01.06.16 19:57:01 MSK

byteorder

Почитай про little endian, big endian. Без этого дальше будет трудно.

signed

Почитай про представление чисел в двоичной системе. И про представление отрицательных чисел.

i-rinat ★★★★★
(01.06.16 20:06:47 MSK)

Ссылка

Ответ на: комментарий от Jopich 01.06.16 19:57:01 MSK

Слушай, без обид. По косвенным оценкам тебе больше 30, ближе к 40. Заканчивал мехмат, работаешь программистом. Как вообще получилось, что для тебя поняти byte order и signed почти ничего не значат? Как? Как мимо этого можно было вообще пройти?

i-rinat ★★★★★
(01.06.16 20:24:34 MSK)

Ссылка

Ответ на: комментарий от slovazap 31.05.16 00:49:08 MSK

В каком месте?

LamerOk ★★★★★
(02.06.16 22:36:30 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Ну и почему оно не линкуется?

Development

Приглашаю потестить новую версию QtWebKit

→

Похожие темы