Производительность реализаций парсинга конфигурационных форматов

benchmark, json, yaml, конфиг, обработка данных

Интересует большая табличка сравнения скорости парсинга различных древовидных форматов конфигураций в разных реализациях. Json например и json-c,jansson иное. TOML например и его реализации. libconfig и так далее. Что бы например им скармливали гигабайтный конфиг и сколько ~~мегахешей~~ мегабайт с секунду они обрабатывали.

Да я гуглю прямо сейчас, но какие то рандомные тесты непонятные везде. Хочется сравнения в один ряд и форматов и реализаций при обработке одних и тех же данных.

Ну вот например https://github.com/serde-rs/json-benchmark/blob/master/README.md только по множеству разных форматов и их реализаций хочется увидеть.

UDP: Короче масштабных сравнений нету в природе вроде

Ссылка

← Как получить текущую раскладку клавиатуры из Python?

Почему частота генерируемого аудиозвука DAC остается неизменной? →

← 1 2 →

Ответ на: комментарий от kolpakchi 13.10.21 13:57:51 MSK

А что годится? Для моих целей json даже избыточен, мне нужны только объекты и строки.

По конкретней пожалуйста … /не понятно о чем речь/

anonymous
(13.10.21 14:00:36 MSK)

Ответ на: комментарий от anonymous 13.10.21 14:00:36 MSK

Sorry

Поконкретней пожалуйста … /не понятно о чем речь/

anonymous
(13.10.21 14:03:51 MSK)

Ссылка

Ответ на: комментарий от anonymous 13.10.21 14:00:36 MSK

Допустим, я захотел сделать свой аналог куба для stm32 и не только. Это примерно чем я сейчас увлекаюсь. Как лучше хранить объекты с описанием регистров (смещение, имя, длина, ссылка на родителя, ссылки на детей и др)? Сейчас у меня база данных на основе json (tinydb). В предполагаемом будущем будет message pack. Я думаю никто не будет спорить, что информация о регистрах это самые настоящие метаданные.

Вот и вопрос: как их лучше хранить, есть ли универсальные ответы или решения?

kolpakchi
(13.10.21 14:10:14 MSK)

Подключал lua, он от природы предназначен чтоб на нем можно было файлы данных делать. Парсит себя сам. Гигабайтный конфиг на луа всех обгонит

pihter ★★★★★
(13.10.21 14:29:24 MSK)

Ссылка

Ответ на: комментарий от kolpakchi 13.10.21 14:10:14 MSK

Вот и вопрос: как их лучше хранить, есть ли универсальные ответы или решения?

Универсальных ответов пока нет.
Что до того «как», смотрите и анализируйте разные форматы бинарного представления данных.

Их море!

Например разработчики 1С 7.7 использовали алгоритмы сериализации и десериализации из MFC … Почитайте о native представления данных в protobuffer, b-tree, B+ деревьях, …, использовании хэшей.
Вам нужно понять СУТЬ, а затем уже сможете сами проектировать эффективные объекты …

anonymous
(13.10.21 14:49:40 MSK)

Ссылка

Ответ на: комментарий от kolpakchi 13.10.21 14:10:14 MSK

ini-формат - лучшее, что можно придумать. Я как-то давно прикола ради ковырялся в сишной библиотечке для парсинга ini, мне не понравилось, что гигабайтный ini-файл уж очень долго парсился. Наделал там всяких оптимизаций и т.п. Повысилась скорость.

А потом я подумал: ну какой идиот будет конфиг писать такой длины? Ну от силы же сотня-другая строчек!!! Их можно вообще в лоб тупо разбирать, ты даже моргнуть не успеешь, как самая тупая реализация все сделает. Хоть на пытхоне!

anonymous
(15.10.21 01:15:18 MSK)