Функции с переменным числом аргументов: va_arg vs void*

0

2

Пытаюсь выбрать наиболее подходящий вариант. Речь идёт о тех случаях, когда количество и тип переменных заранее известно, но вызов должен происходить через некий интерфейс, как, например, через syscall. Фактически, я сейчас пытаюсь определиться между двумя вариантами:

int api1( unsigned int id, ... );
int api2( unsigned int id, const void* arg );

В случае api1 предполагается передавать набор аргументов в зависимости от id.

В случае api2 предполагается передавать указатель на некую структуру, которая будет отличаться в зависимости от id и в которой будет виден весь список аргументов.

Пока что склоняюсь ко второму способу, потому что, во-первых, структуру можно будет объявить заранее статически, а во-вторых, виден список аргументов. Цена вопроса - размер указателя.

А какой вариант предпочли бы вы? Или может существуют ещё способы?

←	Debian + iOS. аудио

openwrt на неподдерживаемое устройство

→

← 1 2 3 →

Я бы выбрал структуру, такой вариант банально реализовать и поддерживать.

Реализовывал функции с вариантивными аргументами всего несколько раз, без манов и тыкания палочкой не смогу сразу нормально написать :)

Bfgeshka ★★★★★
(05.12.25 16:27:26 MSK)

Переменный список аргументов хорош для функций типа printf, когда строка формата парсится в момент выполнения. У вас так вообще может быть третий вариант — массив указателей на функции :)

vodz ★★★★★
(05.12.25 16:41:13 MSK)

Ответ на: комментарий от vodz 05.12.25 16:41:13 MSK

массив указателей на функции

Этот вариант я отмёл практически сразу - функций может быть довольно много, тогда массив получится довольно большим.

~~u5er~~ ★★★
(05.12.25 16:48:24 MSK) автор топика

Второй вариант потенциально более переносимый, особенно если вызывать через всякие ffi

Цена вопроса - размер указателя.

а так же размер структуры т.к просто аргументы могли бы уместиться в регистры в зависимости от calling conversion

mittorn ★★★★★
(05.12.25 16:57:37 MSK)
Последнее исправление: mittorn 05.12.25 16:58:53 MSK (всего исправлений: 1)

Структуры делают там где вызывающий код и так длинный и иначе (без именованных аргументов) легко запутаться. Если функция с всего несколькими аргументами и ты сделаешь структуру то юзерам твоей библиотеки придётся делать кучу обёрток, вся суть которых - разложить аргументы по полям структуры и вызвать твою штуку. Потому как писать

struct args3 s;
s.a = 1;
s.b = 2;
call_by_index(3, &s);

вместо

call_by_index(3, 1, 2);

это мазохизм.

А вообще такие индексированные вызовы без веских причин делать не надо.

firkax ★★★★★
(05.12.25 17:00:21 MSK)
Последнее исправление: firkax 05.12.25 17:05:45 MSK (всего исправлений: 2)

Ответ на: комментарий от mittorn 05.12.25 16:57:37 MSK

а так же размер структуры

Не уверен. Структура - это набор переменных, которые были бы переданны в функцию в качестве аргументов путём копирования. А если я передаю указатель на структуру, то эти аргументы передаются не через стек и/или регистры, а лежат где-то в памяти, а вместо них передаётся указатель.

~~u5er~~ ★★★
(05.12.25 17:05:52 MSK) автор топика

POSIX функция open работает именно как в варианте 1. В libcurl функция curl_easy_setopt объявлена так же, хотя и рассчитана только на один дополнительный аргумент.

Учтите, что оба варианта обходят систему типов. Хотелось бы вариант, который затруднит выстрел себе в ногу, но в данном контексте (сродни системному вызову) его может и не быть.

anonymous
(05.12.25 17:10:57 MSK)

Ответ на: комментарий от firkax 05.12.25 17:00:21 MSK

разложить аргументы по полям структуры и вызвать

А разве есть особая разница между раскладыванием аргументов по полям структуры и раскладыванием аргументов при вызове функции?

А вообще такие индексированные вызовы без веских причин делать не надо.

Реализация RPC - это достаточно веская причина?

~~u5er~~ ★★★
(05.12.25 17:11:49 MSK) автор топика

Второй. Правда надо быть аккуратным при изменении типа указателя, но я в тебя верю.

aiqu6Ait ★★★★★
(05.12.25 17:14:23 MSK)

Ответ на: комментарий от u5er 05.12.25 17:05:52 MSK

Все так, по ID будешь менять тип структуры. Можно даже, если это критично, передавать только указатель на структуру, в первом элементе которой всегда будет храниться ее тип. Но вряд ли получится сильно на этом выиграть, а вот запутаться проще.

aiqu6Ait ★★★★★
(05.12.25 17:15:45 MSK)

Ответ на: комментарий от u5er 05.12.25 17:11:49 MSK

А разве есть особая разница между раскладыванием аргументов по полям структуры и раскладыванием аргументов при вызове функции?

А ты сам не видишь? В 4 раза больше строк и одна лишняя переменная.

Реализация RPC - это достаточно веская причина?

RPC слишком общее понятие. Если ты чисто про код, отвечающий за доставку вызовов по сети, то в нём в любом случае придётся аргументы сериализовать, т.е. структуры или почти структуры там будут неизбежно. Но это нижний уровень абстракций, а на верхнем можно и более удобный интерфейс сделать, индивидуально для каждой функции.

firkax ★★★★★
(05.12.25 17:17:13 MSK)

Ответ на: комментарий от firkax 05.12.25 17:17:13 MSK

А ты сам не видишь? В 4 раза больше строк и одна лишняя переменная.

И какая разница? Ты всё равно всё в одну строчку запишешь, я тебя знаю xD

RPC слишком общее понятие

Пока что это будет LPC, то есть работать на одной машине, но кто знает… Мне нужен механизм, чтоб из одного потока запустить функцию в контексте другого потока и передать ему набор заранее определённых аргументов. Вот сейчас и стою как осёл между двумя стогами сена. Как обычно…

~~u5er~~ ★★★
(05.12.25 17:22:20 MSK) автор топика

например:

maybe_matrix_inv(4, 1, 2,
                    2, 1);

второй вариант тоже может быть где-то удобнее.

nionio35 ★
(05.12.25 17:28:30 MSK)

Ответ на: комментарий от u5er 05.12.25 17:22:20 MSK

И какая разница? Ты всё равно всё в одну строчку запишешь, я тебя знаю xD

Даже если так, эта строчка получится длиннее в несколько раз и некрасиво выглядящей. Вот с теми же сисколлами прекрасный пример: есть низкоуровневый способ запустить сисколл по индексу, а есть libc-обёртки с удобной передачей аргументов.

Мне нужен механизм, чтоб из одного потока запустить функцию в контексте другого потока и передать ему набор заранее определённых аргументов.

Ну, пересылать информацию о вызове между тредами придётся структурой. А дальше как уже писал: можешь сделать красивые обёртки ко всему. Можешь и не делать. Способ со структурой (поскольку он нативный) будет в любом случае, вопрос только в том будет ли он единственным или нет.

firkax ★★★★★
(05.12.25 17:30:34 MSK)

Ответ на: комментарий от aiqu6Ait 05.12.25 17:15:45 MSK

Есть и 3-й вариант. Если по id всё равно switch’ить – то может быть сразу объявить X функций с конкретными аргументами?

т.е. вместо

int apifunc(int id, void *arg) {
    switch (id) {
        case 0:
             (struct data0*)arg;
             break;
        case 1:
             (struct data1*)arg;
             break;
        // и т.д.
    }
}

не морочить голову и сразу сделать

int apifunc0(int a, int b);
int apifunc1(char *x, int y);
int apifuncX(struct ku*);
// …

beastie ★★★★★
(05.12.25 17:38:21 MSK)

Ответ на: комментарий от beastie 05.12.25 17:38:21 MSK

Без шансов - заранее все варианты невозможно предусмотреть.

~~u5er~~ ★★★
(05.12.25 17:40:41 MSK) автор топика

Ответ на: комментарий от u5er 05.12.25 17:40:41 MSK

Так все равно придется предусмотреть. Магии нет. Или ты знаешь размер и содержимое void* по id, или у тебя есть понимание что передается в списке аргументов (как в printf - на основе анализа строки).

aiqu6Ait ★★★★★
(05.12.25 18:34:01 MSK)
Последнее исправление: aiqu6Ait 05.12.25 18:34:14 MSK (всего исправлений: 1)

Ответ на: комментарий от aiqu6Ait 05.12.25 18:34:01 MSK

Или ты знаешь размер и содержимое void* по id

Я знаю содердимое для конкретного id, но я не могу заранее предусмотреть id для всех возможных случаев. Именно в этом вся суть. Если бы я заранее мог знать все возможные варианты, то я бы сделал бы обычный api.

~~u5er~~ ★★★
(05.12.25 18:45:47 MSK) автор топика

Второй. Скопировать указатель быстрее, чем копировать все параметры через стек.

zx_gamer ★★★
(05.12.25 18:48:36 MSK)

Пока что склоняюсь ко второму способу, потому что, во-первых, структуру можно будет объявить заранее статически, а во-вторых, виден список аргументов. Цена вопроса - размер указателя.

А какой вариант предпочли бы вы?

Второй. В ядре довольно часто встречается

	/* Initialize the spi_controller fields */
	host->num_chipselect = 4;
	host->mode_bits = SPI_TX_DUAL | SPI_TX_QUAD | SPI_RX_DUAL | SPI_RX_QUAD;
	host->flags = SPI_CONTROLLER_HALF_DUPLEX;
	host->max_speed_hz = AMD_SPI_MAX_HZ;
	host->min_speed_hz = AMD_SPI_MIN_HZ;
	host->setup = amd_spi_host_setup;
	host->transfer_one_message = amd_spi_host_transfer;
	host->mem_ops = &amd_spi_mem_ops;
	host->mem_caps = &amd_spi_mem_caps;
	host->max_transfer_size = amd_spi_max_transfer_size;
	host->max_message_size = amd_spi_max_transfer_size;

	/* Register the controller with SPI framework */
	err = devm_spi_register_controller(dev, host);

или даже

static struct platform_driver amd_spi_driver = {
	.driver = {
		.name = "amd_spi",
		.acpi_match_table = ACPI_PTR(spi_acpi_match),
	},
	.probe = amd_spi_probe,
};

По-моему, вполне читаемо, особенно по сравнению с десятком безымянных параметров

Или может существуют ещё способы?

JSON 🙂

alx777 ★★★
(05.12.25 20:16:00 MSK)

Ответ на: комментарий от zx_gamer 05.12.25 18:48:36 MSK

Я тут подумал и пришёл к выводу, что такое заявление спорное. Во-первых, перед вызовом всё равно структуру заполнять, а во-вторых, доступ по указателю медленнее. Так что нельзя прям уж так однозначно заявить.

~~u5er~~ ★★★
(06.12.25 02:13:52 MSK) автор топика

Второй конечно же. Меньше шансов ошибиться с аргументами

ckotctvo
(06.12.25 02:20:24 MSK)

Я бы предпочёл второй вариант из-за типобезопасности (тебе надо лишь использовать правильную структуру, ты не можешь передать не тот тип не в той позиции и т. п.). Также это оставляет потенциал для расширения структуры в будущем (добавление полей в конец сохраняет совместимость с предыдущими версиями структуры, а по каким-нибудь флагам внутри структуры можно определять её версию). Такую функцию проще дёргать из других языков программирования по FFI. Функции с переменным числом аргументов вообще лучше наружу не высовывать, они больше сахар для внутренних вызовов, чтобы не объявлять переменные на каждый чих (но для внешнего API ничто не мешает написать обёрток под каждую версию вызова) или где набор аргументов вообще уникален для каждого вызова (например, как у printf).

KivApple ★★★★★
(06.12.25 02:22:26 MSK)
Последнее исправление: KivApple 06.12.25 02:26:26 MSK (всего исправлений: 2)

Ответ на: комментарий от u5er 06.12.25 02:13:52 MSK

Если передаётся много параметров («много» на многих архитектурах примерно больше 6 чисел, в примерах ядерного кода параметров явно больше), то они в любом случае в регистры не влезут и пойдут в стек. А стек находится в ОЗУ так же как и твоя структура. Более того, это буквально та же самая память, ведь такие структуры как правило создают на стеке, а не в куче (та же самая локальность памяти, кеши и т. п.). Просто вместо регистра указателя стека адрес структуры берётся из какого-то другого регистра общего назначения (первые N параметров на современных архитектурах идут в регистрах). В большинстве случаев это будет один-в-один по тактам.

Структура может проиграть только если аргументов очень мало и они все влезают в регистры. Ну или это какая-то экзотическая архитектура, где для передачи аргументов какой-то особый аппаратный стек с отдельной памятью со сверхбыстрым доступом и при этом без возможности произвольной адресации.

KivApple ★★★★★
(06.12.25 02:28:28 MSK)
Последнее исправление: KivApple 06.12.25 02:33:53 MSK (всего исправлений: 5)

Смотря сколько аргументов. Если их много то структура выглядит более подходящей.

urxvt ★★★★★
(06.12.25 03:10:33 MSK)

Ответ на: комментарий от u5er 05.12.25 17:40:41 MSK

Тебе всё равно определять соотношение id → struct.

Добавить struct+switch case или добавить новую функцию – это одно и тоже. Только в случае с функций у тебя хотя бы какая-то гарантия типов.

Т.ч.

набор функций – наибольшая безопасность типов аргументов
*void – шлём что получится и как получится и ловим sigfault на каждый чих
va_args – тут без дополнительных определений, что там будет в аргументах, полный абзац

beastie ★★★★★
(06.12.25 03:12:02 MSK)
Последнее исправление: beastie 06.12.25 03:12:14 MSK (всего исправлений: 1)

Для варианта со структурой можно добавить третий аргумент - размер структуры. Это позволит расширять api добавлением новых полей.

m0xf ★
(06.12.25 06:10:24 MSK)

int api3( unsigned int id, const api3_arg_t* arg );

deep-purple ★★★★★
(06.12.25 09:33:07 MSK)

Ответ на: комментарий от deep-purple 06.12.25 09:33:07 MSK

Не вижу отличий от 2.

~~u5er~~ ★★★
(06.12.25 09:46:17 MSK) автор топика

Ответ на: комментарий от firkax 05.12.25 17:17:13 MSK

В 4 раза больше строк и одна лишняя переменная.

С составными литералами нет необходимости в дополнительной переменной

call_by_index(3, &(struct args3) {1, 2});

No ★★★
(06.12.25 09:54:34 MSK)

Ответ на: комментарий от u5er 06.12.25 09:46:17 MSK

Так и запишем — не понимает сути тайпхинтинга.

deep-purple ★★★★★
(06.12.25 10:39:00 MSK)

Ответ на: комментарий от deep-purple 06.12.25 10:39:00 MSK

А он тут невозможен.

~~u5er~~ ★★★
(06.12.25 10:52:05 MSK) автор топика

Ответ на: комментарий от u5er 06.12.25 10:52:05 MSK

Ладно, невозмогай дальше, я не препятствую.

deep-purple ★★★★★
(06.12.25 10:54:29 MSK)

Кейс с сериализованными данными в аргументе, он уже предлагался?

alnkapa ★
(06.12.25 14:21:38 MSK)

Ответ на: комментарий от firkax 05.12.25 17:00:21 MSK

call_by_index(3, &((struct args3){.a = 1, .b = 2}));

arto ★★
(06.12.25 14:47:29 MSK)

Цена вопроса - размер указателя.

Чё-то не понял, в x32 4 байта, в x64 8 байт, в любом случае структуру передавать всегда удобнее И id можно внутрь структуры поместить, тогда у тебя ф-ция вообще один параметр будет иметь

IvanRia
(06.12.25 16:34:10 MSK)

Ответ на: комментарий от alnkapa 06.12.25 14:21:38 MSK

Это как? Можно пример?

~~u5er~~ ★★★
(06.12.25 16:50:51 MSK) автор топика

Ответ на: комментарий от u5er 05.12.25 17:40:41 MSK

Так ты же апи реализуешь. Делаешь апи с существующими структурами, в апи ver2 добавляешь новые, в апи ver3 добавляешь ещё новые. Смысл поддерживать бесконечный набор структур и айди если твоё апи работает всегда с фиксированным, только может расширяться в дальнейшем. Или пользователь может туда свои собственные структуры пробрасывать? Как тогда апи будет работать с неизвестными для него структурами?

anonymous
(07.12.25 02:25:46 MSK)

Я бы предпочёл написать сигнатуру для каждого id отдельно. Динамика тут неуместна. При вызове ты в любом случае будешь передавать фискированный id и фиксированные параметры.

anonymous
(07.12.25 02:54:34 MSK)

Ответ на: комментарий от anonymous 07.12.25 02:25:46 MSK

Я делаю механизм RPC, который позволит, например, вызвать функцию из одного потока в другом и передать в неё произвольные аргументы. О том, что это за аргуметы я не знаю на этапе разработки этого механизма, поэтому не могу предусмотреть всё заранее. Аргументы и идентификаторы будут прописаны непосредственно при реализации программ, которые будут использовать механизм RPC.

Это как если бы все возможные варианты были бы предусмотрены в printf(), например. Согласись, что это невозможно.

~~u5er~~ ★★★
(07.12.25 09:58:15 MSK) автор топика

Ответ на: комментарий от u5er 07.12.25 09:58:15 MSK

передать в неё произвольные аргументы

В этом твоя главная ошибка. Каждая функция ДОЛЖНА принимать только корректную структуру (тайпхинтинг в помощь). В противном случае она будет обращаться к полям, которе ей нужны в работе, которые не существуют. Речь же о том, чтобы одним аргументом передать все поля, которых может быть мнооого (кстати, в том числе и айди), не перечисляя их как аргументы — верно? А значит, если передана левая структура, то некоторые поля в ней могут отсутствовать. Ну — компайлтайм же, не?

deep-purple ★★★★★
(07.12.25 10:06:46 MSK)

Ответ на: комментарий от deep-purple 07.12.25 10:06:46 MSK

Речь же о том, чтобы одним аргументом передать все поля, которых может быть мнооого (кстати, в том числе и айди), не перечисляя их как аргументы — верно?

Нет. Речь о том, чтоб предоставить механизм, который позволит вызвать функцию в одном потоке из другого, передав в неё неизвестные на этапе написания этого механизма аргументы. То есть вот сейчас, когда я пишу этот механизм, я не знаю, какие аргументы будут передаваться.

Но на этапе, когда я начну писать какой-нибудь код, который будет использовать этот механизм, я определю список id и соответствующие данные, которые будут передаваться через указатель или через набор va_arg и которые будет использовать конкретно этот код. Вот там уже можно и про проверку корректности аргументов поговорить и про обёртки и всё такое-прочее.

А сейчас об этом говорить неуместно впринципе. Ещё раз, представь, что у printf() были бы заранее прописаны все возможные варианты и каждый вариант имел бы свой прототип. Ага?

Кстати, попробуй скомпилировать вот такой код с -Wall:

printf( "value is %s\n", 123 );

Компилятор gcc выдаёт следующее:

main.c:10:28: warning: format '%s' expects argument of type 'char *', but argument 2 has type 'int' [-Wformat=]
   10 |         printf( "value is %s\n", 123 );
      |                           ~^     ~~~
      |                            |     |
      |                            |     int
      |                            char *
      |                           %d

Стало быть, есть способ проверки корректности передаваемых аргументов для va_arg как минимум.

~~u5er~~ ★★★
(07.12.25 10:25:28 MSK) автор топика

Ответ на: комментарий от u5er 07.12.25 09:58:15 MSK

Язык C - это жесткое ограничение? Просто сама задача звучит странно: передать структуру по (void*), потом ее жестко привести по некоему Id к некоему типу без возможности проверить приведение, потом вызывать функции(?) без возможности проверки их наличия. Архитектурная ерунда.

DenProg
(07.12.25 10:55:50 MSK)

Ответ на: комментарий от DenProg 07.12.25 10:55:50 MSK

Архитектурная ерунда

Предлагай варианты.

~~u5er~~ ★★★
(07.12.25 11:04:38 MSK) автор топика

Ответ на: комментарий от u5er 07.12.25 11:04:38 MSK

Сначала ответь на вопрос о необходимости выбора именно этого языка. В его пределах я вряд ли смогу что-то предложить, он немного не для этого.

DenProg
(07.12.25 11:28:24 MSK)

Ответ на: комментарий от DenProg 07.12.25 11:28:24 MSK

Сначала ответь на вопрос о необходимости выбора именно этого языка.

А его и не было :) В тегах стоит си. Я уверен, что в других языках могут и есть удобные инструменты для решения подобных задач, но меня это не интересует, поскольку я пишу на си. Даже если ты мне сейчас предложишь элегантное решение, но на другом языке, то я всё равно его не буду использовать. Такие дела.

~~u5er~~ ★★★
(07.12.25 11:35:49 MSK) автор топика

Ответ на: комментарий от u5er 07.12.25 11:35:49 MSK

… но меня это не интересует, поскольку я пишу на си.

Весьма удобно использовать C++ в качестве а-ля Си, так как C++ имеет некотрые «плюшки», которых нет в Си.

Вообщем у меня код на C++ схож с а-ля Си.
Весьма удобно!

anonymous
(07.12.25 11:40:05 MSK)

int Call(int op, void *args, size_t argsSize);

X512 ★★★★★
(07.12.25 11:42:26 MSK)

Ответ на: комментарий от DenProg 07.12.25 10:55:50 MSK

Архитектурная ерунда.

ioctl в Линуксе так устроен.

X512 ★★★★★
(07.12.25 11:43:16 MSK)

Ответ на: комментарий от anonymous 07.12.25 11:40:05 MSK

имеет некотрые «плюшки», которых нет в Си.

Я всё-таки разведу немножко оффтопа. Вопрос: если я с си перейду на си++, то в процессоре появятся новые инструкции? Очевидный ответ - нет. Второй вопрос: язык си полный по тьюрингу? Очевидный ответ - да. Стало быть, я могу решить любую задачу на си. Таким образом это для меня это довольно слабый аргумент при выборе языка.

Весьма удобно!

Не сомневаюсь, но при выборе языка удобство для меня - это не самый главный пункт ;)

~~u5er~~ ★★★
(07.12.25 12:02:50 MSK) автор топика

← 1 2 3 →

←	Debian + iOS. аудио

Development

openwrt на неподдерживаемое устройство

→

Похожие темы