Werror - контроль качества или занудство?

0

4

Все, кто занимается низкоуровневым жонглированием байтами в реалых промышленных условиях (с кучей поставщиков со всего мира, а не в уютненьком молодёжном стартапе где-нибудь в Саннивейл), понимают, что C’шка с нами надолго, лет на 20, если не больше. И поэтому возникает желание максимально использовать существующие технологии для обеспечения качества кода.

Например, Werror (и то, что к нему полагается в виде -Wall, -Wextra и проч.). Но возникают такие ситуации, как например с «целочисленным повышением» и последующим сравнением с разным знаком. Например:

const unsigned x = 12;
unsigned char y;
unsigned char z;
... // что-то кладём в y и z
if (x < (y*z))
{
   // тра-ля-ля
}

И y*z превращаются («брюки превращаются, превращаются брюки…») в элегантный int, и вылезает предупреждение о различной знаковости, как бы совершенно на ровном месте. Т.е. теперь, чтобы ублажить компилятор, надо дополнительно, например, явно кастануть x к int’у. Т.е., код уже на пределе читаемости (выше пример - это сильное упрощение возможной реальной ситуации), и тут мы ещё добавляем вовсе не интуитивный (int).

И возникает вопрос: а стоит ли овчинка (-Werror и ко.) выделки? Я сейчас, очевидно, не имею в виду код наивысшей критичности, а такой, который при случае можно просто неспеша поправить, в конце рабочего дня, с нулевыми последствиями для пользователей, окружающей среды и т.п.

P.S. кстати, поскольку в расте тоже есть беззнаковые типы, там тоже нечто подобное должно быть, или как?

UPD: в примере, в нагрузку к умножению надо ещё добавить сложение с ещё одним unsigned char.

Ссылка

← Задача по оптимизации сервера // С++

Как в Python написать цикл с постусловием? →

← 1 2 3 →

Ты должен компилировать код по возможности с максимальным количеством включенных дианостик. Потому что базовый синтаксис Си - картошка. И без диагностик компилятор молча проглатывает то, что должно быть ошибками согласно любому здравому смыслу.
Выборочно выключать надо те диагностики, которые генерируют большое количество бесполезных предупреждений и не указывают на реальные проблемы в коде. Например, в коде, над которым я сейчас работаю - это -Wno-unused-parameter -Wno-missing-field-initializers.
В идеале, с настройками, заданными в п 1 и 2, код должен компилироваться с нулём диагностик на машине разработчика и на сборочной ферме. Это нужно, чтобы сразу, как только появляется новая диагностика при компиляции, она была тут же заметна, а не утонула в море других.
Кроме этого, стоит периодически проверять код при помощи статических анализаторов, встроенных в gcc, в clang и при помощи cppcheck. Разумеется, если эти инструменты актуальны для целевой платформы. Они нередко дают false positives, так что требуют внимательности - где он по делу возмущается, а где нет.
Чтобы энфорсить п. 3, на девелоперской машине сборки выполняются с -Werror. Чтобы меньше руки чесались коммитить код с диагностиками в git.
Если продукт поставлятся в виде исходного кода, то в релизном тарболе -Werror по умолчанию должен быть выключен. Это необходимо потому, что пользователь может компилировать код другой версией компилятора или с другими версиями зависимостей, и на его машине могут отображаться дополнительные диагностики. Они не должны мешать компиляции.

wandrien ★★★★
(17.11.23 10:18:13 MSK)
Последнее исправление: wandrien 17.11.23 10:24:40 MSK (всего исправлений: 4)

в расте тоже есть беззнаковые типы, там тоже нечто подобное должно быть, или как?

Или как: https://doc.rust-lang.org/std/primitive.u64.html

dataman ★★★★★
(17.11.23 10:20:23 MSK)

Ссылка

Ответ на: комментарий от wandrien 17.11.23 10:18:13 MSK

В нашем случае нам даётся SDK с исходниками, которые мы адаптируем под наши нужды. Код даётся, который у поставщика собирается вообще без каких либо флагов о ворнингах.

И хрень в том, что до меня уже синтегрировали в продукт такую версию исходников.

И если в новой версии SDK появятся мои правки в самом SDK, пусть даже чтобы все ворнинги исчезли, появятся вопросы. А пулл-реквест принимают люди, которые професионально ближе к железу, чем к корректности ПО. Как-то так.

seiken ★★★★★
(17.11.23 10:33:52 MSK) автор топика

Ответ на: комментарий от seiken 17.11.23 10:33:52 MSK

Если дали как есть, значит пусть как есть и компилируется. И хер с ними, с ворнингами в нём.

Не твоя зона ответственности, не?

wandrien ★★★★
(17.11.23 10:43:54 MSK)

Ответ на: комментарий от wandrien 17.11.23 10:43:54 MSK

Да, спасибо, что подтвердил. Не хочется быть Доном Кихотом. Оптимально, думаю, иметь кастомную ветку, в которой прогонять все проверки, но в проде изменять только явные баги.

seiken ★★★★★
(17.11.23 10:49:42 MSK) автор топика

Ссылка

Ответ на: комментарий от wandrien 17.11.23 10:18:13 MSK

компилятор молча проглатывает то, что должно быть ошибками согласно любому здравому смыслу

Позволю процитировать Кернигана и Ричи: программист сам должен знать, что делает, и поэтому язык Си не мешает ему и позволяет думать самостоятельно.

Ну или как-то так, но суть та же. Там в самом начале еще :)

Zhbert ★★★★★
(17.11.23 10:53:41 MSK)

Ответ на: комментарий от Zhbert 17.11.23 10:53:41 MSK

Позволю себе иметь мнение, отличное от Кернигана и Ричи.

wandrien ★★★★
(17.11.23 10:54:46 MSK)

Ссылка

Ответ на: комментарий от Zhbert 17.11.23 10:53:41 MSK

язык Си не мешает ему и позволяет думать самостоятельно.

Классика: https://github.com/sde-gui/libsmfm-core/commit/37a5cdce8eba7597e5570df7181ae2e1218fe985

Думал самостоятельно vs прочитал диагностику GCC. )

wandrien ★★★★
(17.11.23 10:57:03 MSK)

Ответ на: комментарий от Zhbert 17.11.23 10:53:41 MSK

программист сам должен знать, что делает

В теории должен, по факту - пук-среньк переполнение чуть менее чем во всех сишных программах. Как-то не задалось у прогеров с пониманием своих действий, кароч.

alex1101 ☆
(17.11.23 10:58:19 MSK)

Ссылка

-Werror хорош только на машине разработчика и ci. Он не должен включаться принудительно (разве что -Werror для отдельных ворнингов).
Иначе работающий у разарботчика код не соберётся где-нибудь с другим компилятором

mittorn ★★★★★
(17.11.23 12:13:43 MSK)

явно кастануть

Это и без предупреждения компилятора неплохо самому бы сделать.

grem ★★★★★
(17.11.23 12:28:11 MSK)

Ответ на: комментарий от mittorn 17.11.23 12:13:43 MSK

Аппаратных архитектур всего две, AMD64 и ARM64, «базовые» варианты без SIMD, без Thumb и проч.

И тогда вопрос стоит так, что нужно иметь такой исходный код, который соберётся и vs компилятором, и gcc, как с Werror,Wall,Wextra, так и без оных.

Разумеется, использование ОС-специфичного API для ввода/вывода остаётся за рамками обсуждения, речь о общей части кода.

seiken ★★★★★
(17.11.23 12:29:46 MSK) автор топика

Ответ на: комментарий от grem 17.11.23 12:28:11 MSK

Это и без предупреждения компилятора неплохо самому бы сделать.

Зачем?

seiken ★★★★★
(17.11.23 12:31:49 MSK) автор топика

а давайте мерятся размером варнингов!

вот такое у меня в текущем проекте, правда это С++:

-Wall -Wextra -pedantic -pedantic-errors -Wredundant-decls -Wcast-align -Wcast-qual -Wundef -Wfloat-equal -Wunreachable-code -Wmissing-include-dirs -Wnoexcept -Wpointer-arith -Wwrite-strings -Wlogical-op -Wlogical-not-parentheses -Wbool-compare -Wint-in-bool-context -Wmisleading-indentation -Wswitch -Wswitch-default -Wswitch-bool -Wsign-promo -Wnon-virtual-dtor -Wctor-dtor-privacy

alysnix ★★★
(17.11.23 12:37:50 MSK)

Ссылка

Ответ на: комментарий от seiken 17.11.23 12:29:46 MSK

Ну так -Wextra у разных компиляиоров свои.
например компилятор может выдавать предупреждение при обнаружении в if одинаковых блоков по обе стороны условия. Ошибкой такое не является и мшжет быть результатом работы препроцессора или раскрытия шаблона.
Но под -Werror оно попадает. Мало того, «точность» сравнения этих блоков варирируется от версии компилятора и некоторые компиляторы дают ложное срабатывание

mittorn ★★★★★
(17.11.23 12:49:27 MSK)

тут вопрос - а почему произведение двух unsigned стало знаковым? у проца же две команды умножения - знаковое и беззнаковое. то есть он применил знаковое умножение что ли? или беззнаковое, и посчитал результат знаковым? ерунда какая-то

alysnix ★★★
(17.11.23 12:49:31 MSK)

Ответ на: комментарий от mittorn 17.11.23 12:49:27 MSK

Исключать все такие случаи через Wno-…

seiken ★★★★★
(17.11.23 12:54:39 MSK) автор топика

Ответ на: комментарий от alysnix 17.11.23 12:49:31 MSK

Повышает разрядность чтобы влез результат, ближайшее это short int. В таких случаях надо не умножать, а делить, чтобы остаться в той же разрядной сетке или индивидуально ограничить каждый множитель, но если есть возможность повысить разрядность, то лучше в явном виде ее повысить, но это не всегда возможно, например, для size_t.

soomrack ★★★★★
(17.11.23 13:01:01 MSK)

Ответ на: комментарий от alysnix 17.11.23 12:49:31 MSK

Оно и не стало, подозреваю что ТС привёл не тот пример. Запутаться в implicit conversions (и не только в этом) обычное дело, поэтому включение диагностик/варнигов/санитайзеров/линтеров в общем случае лишним не будет.

anonymous
(17.11.23 13:01:39 MSK)

Ответ на: комментарий от anonymous 17.11.23 13:01:39 MSK

во-во! топикстартер воду мутит! в данном случае все вроде чисто.

alysnix ★★★
(17.11.23 13:03:07 MSK)

Ссылка

Ответ на: комментарий от soomrack 17.11.23 13:01:01 MSK

Повышает разрядность чтобы влез результат, ближайшее это short int

Если речь про пример ТС, то нет. Знаковость тоже учитывается, в примере все типы беззнаковые.

anonymous
(17.11.23 13:10:53 MSK)

Ответ на: комментарий от alysnix 17.11.23 12:49:31 MSK

Гуглить «c integer promotion»

wandrien ★★★★
(17.11.23 13:18:40 MSK)

Ответ на: комментарий от anonymous 17.11.23 13:10:53 MSK

Да вроде нет. Если результат помещается в int (а в AMD64 он помещается, т.к. int это четыре байта), то результат будет int.

man «integer promotion»

soomrack ★★★★★
(17.11.23 13:22:25 MSK)

Ссылка

Ответ на: комментарий от seiken 17.11.23 12:54:39 MSK

Ты не можешь исключить то, что появится в дефолтных ворнингах в будущем. Так же есть неотключаемые ворнинги. Которые с твоим -Werror приведут к невозмрдности сборки.
Зато можно указать -Werror= и указать то, что действительно нужно проверять в этом проекте. Да, список может быть большим, но в лимит по аргументам влезет

mittorn ★★★★★
(17.11.23 13:23:56 MSK)

Ответ на: комментарий от wandrien 17.11.23 13:18:40 MSK

абсурдная идея. правильные языки так не делают. :)

alysnix ★★★
(17.11.23 13:33:50 MSK)

Ответ на: комментарий от alysnix 17.11.23 13:33:50 MSK

Ну как есть))

wandrien ★★★★
(17.11.23 13:35:47 MSK)

Ответ на: комментарий от wandrien 17.11.23 13:35:47 MSK

промоушн надо делать с учетом знаковости короткого исходного типа. то есть промотить знаковый в знаковый, и беззнаковый в беззнаковый. иначе ж.

а стандарт расширяет в знаковый всегда по сути.

alysnix ★★★
(17.11.23 13:37:50 MSK)

Ответ на: комментарий от mittorn 17.11.23 13:23:56 MSK

Ясно. Короче, надо использовать метод белого списка, а не чёрного.

seiken ★★★★★
(17.11.23 13:39:49 MSK) автор топика

@wandrien, @soomrack, @seiken

Чё-то я совсем тупой что ли. С какими флагами собираете, что у вас здесь получатся варнинги:

#include <stdio.h>

int main(void)
{
    const unsigned x = 12;
    unsigned char y = 123;
    unsigned char z = 255;
    if (x < (y*z))
    {
        printf("true\n");
    }
    return 0;
}

anonymous
(17.11.23 13:41:07 MSK)

Ответ на: комментарий от alysnix 17.11.23 13:37:50 MSK

а стандарт расширяет в знаковый всегда по сути.

Да, и это как серпом по яйцам тому, кто в первый раз сталкивается.

seiken ★★★★★
(17.11.23 13:41:16 MSK) автор топика

Ссылка

Ответ на: комментарий от anonymous 17.11.23 13:41:07 MSK

Да, неточность в исходном примере. Добавить третью переменную unsigned char и прибавить к y*z.

seiken ★★★★★
(17.11.23 13:47:52 MSK) автор топика

У нас -Wall -Werror в CI. При этом некоторые бесполезные предупреждения выключены, типа неиспользуемых параметров и подобного.

~~hateyoufeel~~ ★★★★★
(17.11.23 13:50:00 MSK)

Ссылка

Ответ на: комментарий от seiken 17.11.23 12:31:49 MSK

Чтобы как минимум было видно, в том числе и тебе самому, что ты понимаешь, что ты здесь делаешь и избежать возможных ошибок на ровном месте.

Ошибки связанные с преобразованием беззнакового к знаковому и наоборот с переполнением чего-нибудь - одна из частых ошибок.

grem ★★★★★
(17.11.23 13:51:21 MSK)
Последнее исправление: grem 17.11.23 13:54:00 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Zhbert 17.11.23 10:53:41 MSK

Позволю процитировать Кернигана и Ричи: программист сам должен знать, что делает, и поэтому язык Си не мешает ему и позволяет думать самостоятельно.

Как показывает опыт, большая часть программистов на C вообще не думают. Впрочем, судя по получившемуся язычку, в способностях товарищей К. и Р. я тоже сомневаюсь. Говнина же сраная!

~~hateyoufeel~~ ★★★★★
(17.11.23 13:51:50 MSK)

Ответ на: комментарий от hateyoufeel 17.11.23 13:51:50 MSK

Проблема в том, что паскаль был не лучше.

wandrien ★★★★
(17.11.23 13:53:46 MSK)

Ответ на: комментарий от wandrien 17.11.23 13:53:46 MSK

в паскале такого безобразия бы не было!

alysnix ★★★
(17.11.23 13:56:50 MSK)

Ответ на: комментарий от wandrien 17.11.23 13:53:46 MSK

На 1970 его вообще не было. Тем не менее, спустя 10 лет были альтернативы лучше.

~~hateyoufeel~~ ★★★★★
(17.11.23 13:57:28 MSK)

Ссылка

Ответ на: комментарий от alysnix 17.11.23 13:56:50 MSK

Там другое безобразие было)

wandrien ★★★★
(17.11.23 13:57:43 MSK)

Ссылка

Я напомню что all/extra/pedantic не включают все диагностики.

Лучше всего пройтись по документации GCC и потихоньку форсировать в error самые полезные диагностики. Так можно сформировать список диагностик которые упрощают жизнь, при этом сильно не флудят как например из категории pedantic и extra.

a1ba ★★★★
(17.11.23 14:20:16 MSK)

Ссылка

С одной стороны не встречался с ситуацией, чтобы эти предупреждения находили баг в моём коде.

С другой стороны всегда включаю все предупреждения и легко настраиваемые линтеры.

Считаю, что код это улучшает. Даже если баги и не находит. Ну и может это я один такой умный, а всем остальным помогает…

vbr ★★★★★
(17.11.23 14:56:23 MSK)

Ответ на: комментарий от seiken 17.11.23 13:47:52 MSK

Мой вопрос - почему нет варнинга в моём/твоем примере. Умные регистранты обьяснили мне, что y*z должно привестись к int и гугл тоже настаивает на этом, но варнинга нет. И теперь я не пойму почему варнинга нет.

anonymous
(17.11.23 15:14:20 MSK)

Ответ на: комментарий от anonymous 17.11.23 15:14:20 MSK

Потому, что тут нет проблемы: a < b * c, int справа, char слева, тут все однозначно, сюрпризов быть не может.

А вот если a < b * c + d, то тут уже могут быть проблемы, т.к. int плюс char возможно это не то, что хотел автор, но тут проблема минимальна.

А вот если сделать a = b * c, то тут проблема уже серьезная, т.к. вместо 256 может получиться 0.

PS: неявное приведение типов это первое с чем сталкивается программист и от чего ему становится дурно, когда он пытается в этом детально разобраться, а в учебниках про это особо не пишут, что забавно и наводит на всякие мысли.

soomrack ★★★★★
(17.11.23 15:18:49 MSK)
Последнее исправление: soomrack 17.11.23 15:21:36 MSK (всего исправлений: 1)

Ответ на: комментарий от vbr 17.11.23 14:56:23 MSK

С одной стороны не встречался с ситуацией, чтобы эти предупреждения находили баг в моём коде.

Довольно интересно и весьма полезно открыть man gcc и поразмышлять почему варнинги это варнинги, т.е. чем плох такой код на который они срабатывают.

soomrack ★★★★★
(17.11.23 15:23:32 MSK)

Ссылка

Ответ на: комментарий от soomrack 17.11.23 15:18:49 MSK

Потому, что тут нет проблемы: a < b * c, int справа, char слева, тут все однозначно, сюрпризов быть не может.

Если слева от ‘<’, то там unsigned int:

    const unsigned x = 12;
    unsigned char y = 123;
    unsigned char z = 255;
    if (x < (y*z))

если сделаю так, варнинг будет:

    const unsigned x = 12;
    char y = 123;
    char z = 255;
    if (x < (y*z))

так тоже будет:

   const unsigned x = 12;
   int y = 2;
   if (x < y)

собираю gcc или clang с `` -Wall -Wextra -pedantic -O0

anonymous
(17.11.23 15:26:34 MSK)

Ответ на: комментарий от anonymous 17.11.23 15:26:34 MSK

В данном случае приводится к «unsigned int», можешь попробовать прибавить 1 и получить варнинг: a < b * b + 1;

видимо считается, что b*b может не поместиться в int и соотв. тогда все приводится к unsigned int.

soomrack ★★★★★
(17.11.23 15:43:01 MSK)
Последнее исправление: soomrack 17.11.23 15:50:44 MSK (всего исправлений: 2)

Ответ на: комментарий от vbr 17.11.23 14:56:23 MSK

С одной стороны не встречался с ситуацией, чтобы эти предупреждения находили баг в моём коде.

Они не обязательно находят баг в текущем коде. Они обнажают те места кода, выполнение которых качественно меняется, когда (неявные) предусловия, которые соблюдались до момента Х, нарушаются из-за нового контекста использования ПО.

Например, до момента X предполагалось, что входной параметр может принять только значения [v1, v2], а в момент X кто-то подал на вход v3 за пределами данного диапазона. И не он виноват, что это привело к целочисленному переполнению, потому что тип аргумента позволяет хранить в нём v3, и нигде не задокументировано, что нельзя передавать v3.

В Аде можно создавать кастомные целочисленные типы легко и просто:

subtype Voltage is NonNegative range 0 .. 220;

и компилятор в рантайме будет кидать исключение при переполнении, так что эта ошибка не распространится в коде. А в сишке таких проверок нет, и может произойти порча памяти, со всеми вытекающими последствиями.

seiken ★★★★★
(17.11.23 16:07:45 MSK) автор топика

Ответ на: комментарий от soomrack 17.11.23 15:43:01 MSK

видимо считается, что b*b может не поместиться в int и соотв. тогда все приводится к unsigned int.

Наверное. Если здесь смотреть https://en.cppreference.com/w/c/language/conversion

Integer promotion is the implicit conversion of a value of any integer type with rank less or equal to rank of int or of a bit-field of type _Bool(until C23)bool(since C23), int, signed int, unsigned int, to the value of type int or unsigned int.

If int can represent the entire range of values of the original type (or the range of values of the original bit-field), the value is converted to type int. Otherwise the value is converted to unsigned int.

казалось бы, int хватит для произведения двух unsigned char (если в примере умножение на сложение поменять аналогичное поведение). В начале треда я был уверен, что для x*z будет unsigned (просто угадал, правила забы), сейчас правила почитал и уже не особо понимаю почему не int всё таки.

anonymous
(17.11.23 16:26:45 MSK)

Ответ на: комментарий от anonymous 17.11.23 16:26:45 MSK

Ну строго говоря, char это не обязательно один байт, он должен быть достаточным, чтобы хранить символ (необходимых чуть больше 90, кажется, по стандарту).

Минимальное максимальное значение по стандарту для unsigned char – 255.

Минимальное максимальное значение для int по стандарту это 32767.

Так что все логично. uchar * uchar в int не помещается, поэтому должен быть unsigned int.

PS: с этими 64 битными системами совсем забыл, что int раньше был одно слово.

soomrack ★★★★★
(17.11.23 17:37:53 MSK)
Последнее исправление: soomrack 17.11.23 17:38:47 MSK (всего исправлений: 1)

Ответ на: комментарий от soomrack 17.11.23 17:37:53 MSK

Минимальное максимальное значение для int по стандарту это 32767.

Разве не sizeof() на конкретной платформе имеет значение?

bugfixer ★★★★★
(17.11.23 18:24:12 MSK)

Ответ на: комментарий от soomrack 17.11.23 17:37:53 MSK

Понял, согласен, спасибо.

anonymous
(17.11.23 18:29:33 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 →

← Задача по оптимизации сервера // С++

Development

Как в Python написать цикл с постусловием? →

Похожие темы