а вот подскажите библиотеку/класс c++ для чтения fixed size records

1

3

в общем есть файл(ы) типичной структуры:
- мелкий фиксированный заголовок (id. формата, № версии...)
- заголовок чей формат возможно будет зависить от версии
- далее подряд без промежутков идут записи фиксированного размера, формат зависит от версии

не хочется изобретать велосипед, а хочется чё-нить лёгкого без лишней зауми и не тянущего за собой целый фреймворк. Достаточно последовательного доступа на уровне итератора first,next,next..end

ps/ очевидно придётся софтинку переделывать с любимого C на С++;( А всё оттого что некии умники развивая бинарный формат (которому кстати лет больше 10), не просто добавили новых полей в запись, но одно поле в начале каждой записи сделали побольше, а ещё два поменяли местами («так логичнее» блджат). Есть большое подозрение, что на достигнутом они не остановятся, а поддерживать надо всё форматы :(

Ссылка

← Описать процедуру удаления в ебилде

Как сделать на компе 2 локалхоста? →

Зачем, если это пишется очень легко и непринужденнно?

panter_dsd ★★★★★
(04.12.14 11:39:55 MSK)

Ответ на: комментарий от panter_dsd 04.12.14 11:39:55 MSK

Наверное, потому что не хочется самому париться с буферизацией, аллокаторами и прочим байтоводтством?

// Подписался на тред

jeuta ★★★★
(04.12.14 11:58:29 MSK)

Ответ на: комментарий от jeuta 04.12.14 11:58:29 MSK

Какая буфферизация? Какие аллокаторы? Определяется труктура, reinterpret_cast к структуре, передвижение позиции на размер структуры.

panter_dsd ★★★★★
(04.12.14 12:02:59 MSK)

Вроде там есть FileStream.

FileStream file ....;
int id;
int version;
int records;
file >> id;
file >> version;
file >> records;

for (int i=0;i<records;i++)
{
    our_struct tmp;

    ....
    file >> tmp.int;
    file >> tmp.float;
    ....
    
    our_vector.add(our_struct);


}

Как-то так.

crutch_master ★★★★★
(04.12.14 12:03:00 MSK)

Ссылка

А всё оттого что некии умники развивая бинарный формат (которому кстати лет больше 10), не просто добавили новых полей в запись, но одно поле в начале каждой записи сделали побольше, а ещё два поменяли местами («так логичнее» блджат). Есть большое подозрение, что на достигнутом они не остановятся, а поддерживать надо всё форматы :(

Вот же олени.

crutch_master ★★★★★
(04.12.14 12:04:34 MSK)

чё? тебе для этого


struct PACKED Record {
  uint32_t a;
  uint16_t b;
  uint8_t c;
  uint8_t d;
} record;
..
read(fd, (void *)&record, sizeof(Record));

нужна библиотека на бусте в перемешку с стл? Да ты гонишь.

~~nanoolinux~~ ★★★★
(04.12.14 12:08:50 MSK)

Ответ на: комментарий от panter_dsd 04.12.14 12:02:59 MSK

Буфферизация опциональна, но иногда полезна для производительности (зависит от объёмов). Аллокаторы не нужны. А вот с reinterpret_cast вон из профессии - во-первых, нет никаких гарантий на выравнивание, во-вторых, endianess. Поэтому нужно читать в байтовый буффер, потом заполнять из него структуру строя широкие поля из отдельных байтов.

Готового фреймворка для этого я не знаю, поэтому как раз пишу свой.

slovazap ★★★★★
(04.12.14 12:13:26 MSK)

Ответ на: комментарий от slovazap 04.12.14 12:13:26 MSK

Порядок байт легко конвертируется, поэтому проблем не вижу.

panter_dsd ★★★★★
(04.12.14 12:16:08 MSK)

Ответ на: комментарий от slovazap 04.12.14 12:13:26 MSK

А вот с reinterpret_cast вон из профессии - во-первых, нет никаких гарантий на выравнивание, во-вторых, endianess.

А вот и сферический программист в вакууме.

~~nanoolinux~~ ★★★★
(04.12.14 12:20:34 MSK)

IMNSHO, тут как раз паттерн для фабрики. Вопрос будешь ты делать это на си или си++, соотно фабрика должна вернуть либо пару указателей на функции чтения-записи формата, либо объект, этим занимающийся.

~~pef-secure~~
(04.12.14 12:34:01 MSK)

Ссылка

Ответ на: комментарий от slovazap 04.12.14 12:13:26 MSK

А вот с reinterpret_cast вон из профессии

Ну, т.е. тот, кто придумал этот элемент языка, должен был пойти работать дворником? Как же ж так вышло, что при создании языка забыли видного специалиста спросить, как slovazap? Непорядок!

~~pef-secure~~
(04.12.14 12:36:48 MSK)

очевидно придётся софтинку переделывать с любимого C на С++
поддерживать надо всё форматы

Как это связано, интересно?

В сложных случаях, если макросами или функциями получается плохо, можно генерировать сериализатор/десериализатор пакетов

anonymous
(04.12.14 12:38:13 MSK)

Ссылка

Ответ на: комментарий от nanoolinux 04.12.14 12:08:50 MSK

чё? тебе для этого...

мне для того, что потом из этого получается, чтобы одноообразно читать транспортные форматы от разных версий и конверсить их в рабочую структуру/объект

struct PACKED Record_v1 {
  uint32_t a;
  uint16_t b;
  uint8_t c;
  uint8_t d;
};
struct PACKED Record_v2 {
  uint32_t a;
  uint16_t b;
  uint16_t c; //<- например тут байтик добавили
  uint8_t d;
};
struct PACKED Record_v3 {
  // то-же чуть другой формат
};

MKuznetsov ★★★★★
(04.12.14 12:44:05 MSK) автор топика

Ответ на: комментарий от panter_dsd 04.12.14 12:16:08 MSK

Порядок байт легко конвертируется, поэтому проблем не вижу.

Я назвал две причины почему это не работает, а не одну.

Ну, т.е. тот, кто придумал этот элемент языка, должен был пойти работать дворником?

Нет.

slovazap ★★★★★
(04.12.14 13:08:16 MSK)

Ответ на: комментарий от slovazap 04.12.14 13:08:16 MSK

Если ты про выравнивание, то есть #pragma pack.

panter_dsd ★★★★★
(04.12.14 13:10:20 MSK)

Ответ на: комментарий от panter_dsd 04.12.14 13:10:20 MSK

Я повторяю, #pragma pack не даёт никаких гарантий. Более того, это вообще не конструкция языка C/C++.

slovazap ★★★★★
(04.12.14 13:12:18 MSK)

Ссылка

Ответ на: комментарий от nanoolinux 04.12.14 12:20:34 MSK

>А вот с reinterpret_cast вон из профессии - во-первых, нет никаких гарантий на выравнивание,
А вот и сферический программист в вакууме.

Хрен там, сферические - это как раз вы, те, кто считает, что «весь мир состоит из Intel-PC».

alegz ★★★★★
(04.12.14 13:14:44 MSK)

Ответ на: комментарий от pef-secure 04.12.14 12:36:48 MSK

> А вот с reinterpret_cast вон из профессии
Ну, т.е. тот, кто придумал этот элемент языка, должен был пойти работать дворником?

Не за сам элемент, а за его использование для сериализации структур.

alegz ★★★★★
(04.12.14 13:15:59 MSK)

Ссылка

Ответ на: комментарий от alegz 04.12.14 13:14:44 MSK

Intel-PC

Хаха, я вообще для арма пишу. А начальник сейчас уговаривает для микроблейза чего-то наваять. Так что мимо.

Прикол в том, что хоть с интерпрет, хоть без него ты ничего вменяемого на сплюсе всё равно не напишешь. Такие дела бро.

~~nanoolinux~~ ★★★★
(04.12.14 13:48:18 MSK)

Ответ на: комментарий от MKuznetsov 04.12.14 12:44:05 MSK

Вот тебе конвертер на эрланге. ~~За пять с половиной минут можно написать тсп сервер, и повесить на vps. Но это уже другая история.~~

conv(Bin) ->
  {A,B,C,D} = parce(Bin),
  <<A:32, B:32, C:32, D:32>>.

parce(B) ->
  <<V:1, Rest/binary>> = B, % one byte for version, for example.
  case V of
    0 -> parce(v1, Rest);
    1 -> parce(v2, Rest);
    2 -> parce(v3, Rest)
  end.

parce(v1, <<A:32, B:16, C:8, D:8>>) -> {A,B,C,D};
parce(v2, <<A:32, B:16, C:16, D:8>>) -> {A,B,C,D};
parce(v3, <<A:32, B:16, C:16, D:16>>) -> {A,B,C,D}.

~~nanoolinux~~ ★★★★
(04.12.14 14:03:24 MSK)
Последнее исправление: nanoolinux 04.12.14 14:06:16 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от nanoolinux 04.12.14 13:48:18 MSK

Прикол в том, что хоть с интерпрет, хоть без него ты ничего вменяемого на сплюсе всё равно не напишешь

Без reinterpret будет

Поэтому нужно читать в байтовый буффер, потом заполнять из него структуру строя широкие поля из отдельных байтов.

типа забираешь из буфера следующий кусок по схеме (с учётом версии в т.ч.), делаешь ntoh* в поле числа если нужно и т.д.

http://en.wikipedia.org/wiki/Comparison_of_data_serialization_formats

motto
(04.12.14 14:32:38 MSK)

Ссылка

Ответ на: комментарий от MKuznetsov 04.12.14 12:44:05 MSK

например тут байтик добавили

Судя по http://www.boost.org/doc/libs/1_57_0/libs/serialization/doc/tutorial.html#ver... boost тут никак.

motto
(04.12.14 15:52:06 MSK)

Ссылка

Ответ на: комментарий от MKuznetsov 04.12.14 12:44:05 MSK

struct PACKED Record {
  uint32_t a;
  uint16_t b;
  uint8_t c;
  uint8_t d;
} record;

struct PACKED Record_v1 {
  uint32_t a;
  uint16_t b;
  uint8_t c;
  uint8_t d;
};
struct PACKED Record_v2 {
  uint32_t a;
  uint16_t b;
  uint16_t c; //<- например тут байтик добавили
  uint8_t d;
};
struct PACKED Record_v3 {
  // то-же чуть другой формат
};

inline template<class T> int my_read(T& x){
      return read(fd, (void *)x, sizeof(T));
}

так?

next_time ★★★★★
(04.12.14 21:50:12 MSK)

Ответ на: комментарий от next_time 04.12.14 21:50:12 MSK

Не (void *)x, а &x.

И не так:

#include <cstdint>
#include <algorithm>

struct Record_v1 {
  uint32_t a;
  uint16_t b;
  uint8_t c;
  uint8_t d;
};

struct Record_v2 {
  uint32_t a;
  uint16_t b;
  uint16_t c; //<- например тут байтик добавили
  uint8_t d;
};

int main() {
    {
        static char buf[256];
        Record_v1 x = {1, 2, 3, 4};
        std::copy((char*)&x, (char*)&x + sizeof(x), buf);
        Record_v2 *y = (Record_v2*)buf;
        printf("a = %d, b = %d, c = %d, d = %d\n", y->a, y->b, y->c, y->d);
        // a = 1, b = 2, c = 1027, d = 0
    }
    {
        static char buf[256];
        Record_v2 x = {1, 2, 3, 4};
        std::copy((char*)&x, (char*)&x + sizeof(x), buf);
        Record_v1 *y = (Record_v1*)buf;
        printf("a = %d, b = %d, c = %d, d = %d\n", y->a, y->b, y->c, y->d);
        // a = 1, b = 2, c = 3, d = 0
    }
}

Максимум на данной машинке можно сделать write данной структуре, чтобы потом сделать обратно read в неё же — выравнивание, порядок байт, более сложная сериализация и версионинг с конвертациями потребуют таки писать нормально.

motto
(05.12.14 10:28:32 MSK)