GCC 4.6.0

gcc, gnu, gpl

0

1

Вышла новая версия GNU Compiler Collection — 4.6.0.

Новшества:

улучшения в использовании памяти и скорости компиляции;
поддержка языка программирования Go;
новый уровень оптимизации -Ofast, который включает в себя все ключи из -O3 и ключи, позволяющие получить ещё более оптимизированный код, например -ffast-math;
улучшения в LTO (Link-Time Optimization);
улучшения в IPO (межпроцедурная оптимизация);
на 32-х битных системах теперь по умолчанию задействован ключ -fomit-frame-pointer (кроме -Os).

Добавлена поддержка следующих процессоров:

Intel Core i3/i5/i7 (-march=corei7, -mtune=corei7);
Intel Core i3/i5/i7 с новым набором инструкций — AVX (-march=corei7-avx, -mtune=corei7-avx);
AMD Bobcat (-march=btver1, -mtune=btver1).

Анонс

>>> Полный список изменений

Ссылка

← Вышел Xen 4.1

RiM PlayBook может исполнять Android-приложения →

← 1 2 3 4 5 6 7 8 9 10 11 12 →

Ответ на: комментарий от devl547 26.03.11 21:36:43 MSK

да! GCC 4.4.5 с теми же опциями, без выравнивания и с оптимизациями выдал на 15 секунд быстрее.

//regressions make me cry T.T

devl547 ★★★★★
(26.03.11 21:40:11 MSK)

Ответ на: комментарий от devl547 26.03.11 21:40:11 MSK

Может, в 4.5 стоит включить -fexcess-precision=fast ?

~~tmpusr~~
(26.03.11 21:51:13 MSK)

Ответ на: комментарий от tmpusr 26.03.11 21:51:13 MSK

один фиг

devl547 ★★★★★
(26.03.11 21:54:34 MSK)

Support for hot-patchable function prologues via the ms_hook_prologue attribute for x86_64 in addition to 32-bit x86.

Поддержка, необходимая для Steam между прочим.

anonymous
(26.03.11 22:02:47 MSK)

Ответ на: комментарий от anonymous 26.03.11 22:02:47 MSK

Это что-то про трояны, да?

devl547 ★★★★★
(26.03.11 22:05:51 MSK)

Ответ на: комментарий от devl547 26.03.11 22:05:51 MSK

Да, да. Следи за звездочками, не отвлекайся.

anonymous
(26.03.11 22:08:42 MSK)

Ссылка

Ответ на: комментарий от devl547 26.03.11 21:54:34 MSK

Тогда, я пас. //Жду-недождусь того дня, когда clang будет готов для сборки всей системы

~~tmpusr~~
(26.03.11 22:11:32 MSK)

Ответ на: комментарий от tmpusr 26.03.11 22:11:32 MSK

> когда clang будет готов для сборки всей системы

я боюсь, что и из него сделают в итоге тормозную бяку.

devl547 ★★★★★
(26.03.11 22:12:57 MSK)

Ответ на: комментарий от devl547 26.03.11 22:12:57 MSK

>я боюсь, что и из него сделают в итоге тормозную бяку

каким образом? он же полностью модульный

annulen ★★★★★
(26.03.11 22:13:40 MSK)

Ответ на: комментарий от tmpusr 26.03.11 22:11:32 MSK

>Жду-недождусь того дня, когда clang будет готов для сборки всей системы

А что сделал для этого ЛИЧНО ТЫ?

annulen ★★★★★
(26.03.11 22:14:15 MSK)

Ответ на: комментарий от annulen 26.03.11 22:14:15 MSK

> А что сделал для этого ЛИЧНО ТЫ?
Я? Ждал, жду и буду ждать. А что? Что я должен был сделать? Написать патчей? Тогда он действительно станет «тормозной бякой».
Я вообще собираюсь Qt4 учить и писать лёгкий DE на нём.

~~tmpusr~~
(26.03.11 22:18:46 MSK)

Ответ на: комментарий от tmpusr 26.03.11 22:18:46 MSK

>Что я должен был сделать?

Тестить сборку системы и репортить баги

Тогда он действительно станет «тормозной бякой».

Говнопатч не примут, это же не столмановская богадельня

annulen ★★★★★
(26.03.11 22:21:53 MSK)

Ответ на: комментарий от annulen 26.03.11 22:13:40 MSK

Найдут способ.

//я до сих пор считаю идеалом код одной корейской игрушки, где была 1 строчка коммента на 5 строк кода + flow-chart'ы и четкие указания в какие файлы и что нужно дописывать, если хочешь расширить функциональность.

devl547 ★★★★★
(26.03.11 22:21:53 MSK)

Ссылка

Ответ на: комментарий от annulen 26.03.11 20:55:54 MSK

В rh gcc с патчами, от ванильного gcc он сильно отличается.

Reset ★★★★★
(26.03.11 22:28:18 MSK)

Ответ на: комментарий от annulen 26.03.11 22:14:15 MSK

ты когда запилишь libpng с SIMD? :3

megabaks ★★★★
(26.03.11 22:35:48 MSK) автор топика

Ответ на: комментарий от annulen 26.03.11 22:21:53 MSK

> Тестить сборку системы и репортить баги
Я думаю, репортов о том, что ядро не собирается, там и так полно.

~~tmpusr~~
(26.03.11 22:37:32 MSK)

Ответ на: комментарий от tmpusr 26.03.11 22:37:32 MSK

.36 собиралось же вроде?

annulen ★★★★★
(26.03.11 22:47:44 MSK)

Ответ на: комментарий от annulen 26.03.11 22:47:44 MSK

Хм. А говорили, что кроме как gcc ядро ничем больше не собирается. Надо бы проверить.

~~tmpusr~~
(26.03.11 22:48:51 MSK)

Ссылка

Ответ на: bzip2 бенчмарки от Sylvia 26.03.11 20:35:54 MSK

сменила ванильный 4.5.3pre на 4.5.2 из редхат ветки
бенчмарк между ними
256 Mb bzip2 -9:

vanilla: 1m24.217s
redhat: 1m24.288s
т.е. по сути без разнцицы

далее для -O2 -fomit-frame-pointer -march=core2

1Gb gzip -9 (без asm):

GCC 4.3 0m46.117s
GCC 4.4 0m46.866s
GCC 4.5 0m48.066s
GCC 4.6 0m43.673s

256 Mb xz:

GCC 4.3 2m10.624s
GCC 4.4 2m9.781s
GCC 4.5 2m12.250s
GCC 4.6 2m4.807s

4.6 себя показывает достаточно неплохо, в сравнении, т.е. оптимизацию для корки2 улучшили.

с bzip2 конечно вышло совсем не радужно... по-хорошему надо брать gprof хотя бы и отлавливать тот кусок кода , который выдает такую безобразную регрессию....

Sylvia ★★★★★
(26.03.11 22:51:14 MSK)

Ответ на: комментарий от Reset 26.03.11 22:28:18 MSK

не во всех версиях, или в SVN не все патчи идут,
в целом - он вкуснее в плане стабильности или бэкпорта некоторых возможностей
например поддержка core2 в 4.1 ветке (ваниль - 4.3)
или atom в 4.4 (4.5)

Sylvia ★★★★★
(26.03.11 23:04:59 MSK)

Ссылка

Ответ на: комментарий от Sylvia 26.03.11 22:51:14 MSK

>по-хорошему надо брать gprof

и профилировать ВООБЩЕ ВСЕ

devl547 ★★★★★
(26.03.11 23:09:32 MSK)

Ответ на: комментарий от devl547 26.03.11 23:09:32 MSK

зачем все? в gzip и xz например все в порядке

Sylvia ★★★★★
(26.03.11 23:11:15 MSK)

Ответ на: комментарий от Sylvia 26.03.11 23:11:15 MSK

>например все в порядке

и весь код идеален?

devl547 ★★★★★
(26.03.11 23:16:28 MSK)

Ответ на: комментарий от devl547 26.03.11 23:16:28 MSK

Вы идиот? Причём тут код пользовательского приложения? Тут GCC обсуждают.

anonymous
(26.03.11 23:20:56 MSK)

Ответ на: комментарий от anonymous 26.03.11 23:20:56 MSK

фу таким быть
вы - хам!

megabaks ★★★★
(26.03.11 23:22:56 MSK) автор топика

Ответ на: комментарий от megabaks 26.03.11 23:22:56 MSK

Странно от тебя это слышать =)

~~tmpusr~~
(26.03.11 23:24:20 MSK)

Ответ на: комментарий от tmpusr 26.03.11 23:24:20 MSK

я ранее был хамом?
ппц...я себя ненавижу :3

megabaks ★★★★
(26.03.11 23:25:33 MSK) автор топика

Ответ на: комментарий от megabaks 26.03.11 23:25:33 MSK

Особенно, когда выпьешь)
Я (KevinDetry) всё помню =)

~~tmpusr~~
(26.03.11 23:27:05 MSK)

Ответ на: комментарий от tmpusr 26.03.11 23:27:05 MSK

Оооо - с возвращением - я скучал
кстати да - как ни странно - я опять выпимшЫ )

megabaks ★★★★
(26.03.11 23:29:27 MSK) автор топика

Ответ на: комментарий от devl547 26.03.11 23:16:28 MSK

пфф.. обьясняю,
сейчас с тестами bzip2 я продемонстрировала регрессию в производительности, около 30%, регрессия проявилась начиная с 4.4 ветки и существует в 4.4 4.5 и 4.5

время компрессии возросло с 50 секунд , на 15 секунд и более

в тестах с gzip и xz - этого нет. следовательно что-то не так с bzip2

надо брать bzip2 , компилить с -pg и смотреть в каких функциях отмечается наибольшее возрастание времени потребления процессора, потом смотреть код этих функций, оптимальный вариант - найти кусок кода , который плохо оптимизируется начиная с 4.4, и сделать из него testcase ( например простенький цикл ) зациклив который можно убедиться в том, что GCC 4.3 его компилит нормально, а вот GCC 4.4 компилит его уже так что он тормозит...
C этим в принципе есть хорошие шансы того, что багу исправят быстро и не оставят без внимания.
Я не вижу смысла устраивать аудит всего абсолютно кода везде, титанический труд, есть конкретная проблема с bzip2, есть инструменты для профилирования (не путать с PGO)

Sylvia ★★★★★
(26.03.11 23:30:51 MSK)

Ответ на: комментарий от megabaks 26.03.11 23:29:27 MSK

А я и не возвращался ^_^
Посмотри на ник, это времянка.
Вернусь, когда свою idea на Qt4 напишу)
Вот зря ты так, не убивай своё здоровье, кто будет optimization.hardlinux.ru развивать, если не ты?

~~tmpusr~~
(26.03.11 23:32:38 MSK)

Ответ на: комментарий от anonymous 26.03.11 23:20:56 MSK

>Тут GCC обсуждают.

Причем тут анонимусы, они вообще на /b/ сидят только.

devl547 ★★★★★
(26.03.11 23:35:12 MSK)

Ссылка

Ответ на: комментарий от Sylvia 26.03.11 23:30:51 MSK

потести на -march=i686

megabaks ★★★★
(26.03.11 23:52:24 MSK) автор топика

Да ёлки палки. Вот только ЛибреОфис собрал. Ждем 4.6.1 >_<

vasily_pupkin ★★★★★
(26.03.11 23:54:16 MSK)

Ответ на: комментарий от tmpusr 26.03.11 23:32:38 MSK

да - на поддержку надо время
ща назрело несколько страниц, но сцуко тааак лень (

megabaks ★★★★
(26.03.11 23:54:41 MSK) автор топика

Ссылка

Ответ на: комментарий от megabaks 26.03.11 23:52:24 MSK

128 Mb bzip2 -9
-O2 -march=i686

4.3 0m26.177s
4.4 0m28.868s

(для сравнения с тем что выше время x2) те 52 и 56 с, кстати не так сильно возрастает время компрессии в сравнении с 4.3 vs 4.4 @ Core2

4.3 -march=core2 конечно быстрее будет, а вот для 4.4+ - i686

Sylvia ★★★★★
(27.03.11 00:01:38 MSK)

Ответ на: комментарий от Sylvia 27.03.11 00:01:38 MSK

PS: опять для гентушников проблему заложили... бинарщики то не собирают с -march=core2

Sylvia ★★★★★
(27.03.11 00:02:19 MSK)

Ответ на: комментарий от Sylvia 27.03.11 00:02:19 MSK

в slitaz вообще наркоманы и собирают для i486 )))

devl547 ★★★★★
(27.03.11 00:03:07 MSK)

Ссылка

Ответ на: комментарий от Sylvia 27.03.11 00:01:38 MSK

ну 4.3 рип
оно не в счёт

megabaks ★★★★
(27.03.11 00:12:03 MSK) автор топика

Ответ на: комментарий от megabaks 27.03.11 00:12:03 MSK

в счет
1) он еще поддерживается, хотя и не особенно активно.
см gcc.gnu.org

2) регрессия с bzip2 вылезла при переходе от 4.3 к 4.4

Sylvia ★★★★★
(27.03.11 00:18:05 MSK)

Ответ на: комментарий от Sylvia 27.03.11 00:18:05 MSK

ну де факто 4.3 - рип
посему - оно не имеет значения
а вот на 4.4 и далее на том же бзипе 686 наилучший выбор

megabaks ★★★★
(27.03.11 00:20:56 MSK) автор топика

Ответ на: комментарий от megabaks 27.03.11 00:20:56 MSK

посмотри табличку сравнения, я уж лучше клангом соберу )
и кстати с точки зрения багрепорта - сравнить надо как раз с 4.3, каким бы старым он ни был...

PS: займитесь пожалуйста кому не лень и есть время...

Sylvia ★★★★★
(27.03.11 00:26:17 MSK)

Ссылка

Ответ на: комментарий от megabaks 26.03.11 22:35:48 MSK

>ты когда запилишь libpng с SIMD? :3

во-первых, я пока нашел для себя более интересный проект :3

во-вторых, надо бы подтвердить или опровергнуть мою гипотезу о важности оптимизации zlib в скорости загрузки

annulen ★★★★★
(27.03.11 00:34:43 MSK)

Ответ на: комментарий от megabaks 27.03.11 00:20:56 MSK

>ну де факто 4.3 - рип

а 4.2 еще живет :)

annulen ★★★★★
(27.03.11 00:58:16 MSK)

Ответ на: комментарий от annulen 27.03.11 00:34:43 MSK

я потыкал примитивы от штеуда
первое - они не соответствуют реальности
второе - мне тупо лень разгребать их костыли
третье - ты уверен что тормоза в сжатии?

megabaks ★★★★
(27.03.11 01:02:59 MSK) автор топика

Ответ на: комментарий от annulen 27.03.11 00:58:16 MSK

это про правилах форума аль о некрофилах?

megabaks ★★★★
(27.03.11 01:04:31 MSK) автор топика

Ответ на: комментарий от Sylvia 27.03.11 00:01:38 MSK

Странно вас читать тут. Вы неправильно меряете же ) -march — это грубо говоря тот набор инструкций, которые будут доступны gcc при генерации результата. А -mtune это и есть та целевая платформа, под которую идёт оптимизация. Если вы не указываете -mtune, то вы оптимизируете под абстрактуную платформу и используете -mtune=generic. Сделайте тесты с -O3 -march=native -mtune=native -flto для gcc-4.5+, а то как-то неинтересно совсем ваши сравнения читать )

GArik ★★★
(27.03.11 03:53:04 MSK)

Ответ на: комментарий от GArik 27.03.11 03:53:04 MSK

>Если вы не указываете -mtune, то вы оптимизируете под абстрактуную платформу и используете -mtune=generic.

если не указано тогда =march, -mtune=generic нужно указывать явно.

Сделайте тесты с -O3 -march=native -mtune=native -flto для gcc-4.5+

сделайте сами, я специально тестировала самый типичный безопасный набор флагов, с которым соберется и будет работать все. -O2 оптимальные флаги для оптимизации по соотношению производительности к стабильности, собственно бинарные дистрибутивы все с этим и собраны, ну а -O3 пожалуйста тестируйте сами и собирайте с ним... ежели хотите, только на возможные глюки пеняйте потом на себя.

Sylvia ★★★★★
(27.03.11 04:02:55 MSK)

Ответ на: комментарий от Sylvia 27.03.11 04:02:55 MSK

Ага, нашёл в мане «specifying -march=cpu-type implies -mtune=cpu-type», извиняюсь, что недосмотрел.

GArik ★★★
(27.03.11 04:15:13 MSK)

Ответ на: комментарий от GArik 27.03.11 04:15:13 MSK

еще нюансы -
-march и -mtune могут быть заданы и по умолчанию во время сборки gcc, достаточно часто используется generic, но чтобы он работал в таком случае, нужно не задавать march

-march=native может внутренне выбирать -mtune=generic для определенных моделей процессоров, если считается, что оптимизация под абстрактный средний процессор будет работать быстрее , нежели другое значение

-flto с GCC 4.5 использовать лучше не стоит, оно не стабильно, с 4.6 - must try it, его переработали, хотя с сборкой библиотек я бы была осторожнее,

-O3 , я уже написала про стабильность, набор экспериментальных оптимизаций который ничего не гарантирует, кроме того с снапшотами 2 месячной давности GCC 4.6 оптимизация выше -O2 работала очень нестабильно.

по поводу -march=native - вы плохо смотрели тесты и сообщения им предшествующие, хитрость в том, что кое в чем generic может обходить вариант native, равно как например --param l1-cache-size и --param l2-cache-size лучше задавать меньше реального размера, во всяком случае для CFLAGS, большие кеши современных корок с попыткой полной утилизации с -march=native и код раздувают и могут даже приводить к тому что он будет медленнее работать ( нужно тестировать с приложениями )

в остальном не стану повторяться.

Sylvia ★★★★★
(27.03.11 04:25:36 MSK)

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 4 5 6 7 8 9 10 11 12 →

← Вышел Xen 4.1

GNU's Not Unix

RiM PlayBook может исполнять Android-приложения →

Похожие темы