Да ладно тебе birdie ныть. Учитывая просто офигенную многоплатформенность кода от студии (я имею ввиду что программы работают на всех x86 платформах под управлением любой ОС семейства виндовс) результат не выглядит таким уж плохим. Я бы даже сказал выглядит вполне достойно. И флажки вон чел подсказал, ffast-math обычно неплохо помогает, и он вроде в O3 не входит, ибо опасный.
Я сейчас немного экспериментирую и могу сказать, что оптимизация под конкретный процессор, сделанная вручную очень рулит.
Пример: вычисление предлагаемой программой (aptest) 1048576 цифр числа "пи" без ассемблерных вставок, чисто на Си для 64-битной платформы даёт на g++ 42.230 сек (на моём компьютере), с ассемблером (только для критичных участков) - 6.280 сек. Что называется, почувствуйте разницу.
Не вижу проблем с кросплатформенностью. Между прочим, не настаиваю, но кажется Microsoft'овский компилятор C++ компилирует не только для x86 или x86-64. Если не в публичной версии, то во внутрифирменной.
Я тоже не знаю, но вряд ли был разработан совершенно новый код компилятора. Правда M$ могла и просто, как они обычно делают, купить стороннюю разработку.
> Я ведь сравниваю один и тот же код, скомпилированный разными компиляторами ... причём тут оптимизация на ассемблере?
К тому, что иногда она даёт для критических участков потрясающий результат. А по ссылке там, кстати, не только ассемблер, а полный набор вариантов для разных компиляторов и платформ (x86 и x86-64)
>К тому, что иногда она даёт для критических участков потрясающий результат.
и что, автору 7z было лень включить уже написанные ассемблерные вставки (или переписать если синтаксис ассемблеров отличается) под тот же x86 только для линукса ? звучит не реалистично.