native
На вот. Поставь на CFLAGS

-O2 -pipe -march=native -mtune=generic -msse4.1 -mmmx -ffast-math -mcx16 -msahf -mfpmath=sse -fomit-frame-pointer -funroll-loops -finline-functions -ftree-vectorize

Bad_ptr ★★★★★
(13.01.13 10:58:01 MSK)
Последнее исправление: Bad_ptr 13.01.13 10:59:46 MSK (всего исправлений: 1)

Ты не поверишь, но либо core2, либо native.

~~Kindly_Cat~~ ☆
(13.01.13 10:59:08 MSK)

Ответ на: комментарий от Kindly_Cat 13.01.13 10:59:08 MSK

зачем вообще изменять эту переменую если для любой машины самое то будет - native.

white_ghost
(13.01.13 11:23:56 MSK)

Ответ на: комментарий от Bad_ptr 13.01.13 10:58:01 MSK

Не советуй вредной чепухи.

-march=native -O2 -pipe

~~Kindly_Cat~~ ☆
(13.01.13 11:25:19 MSK)

Ответ на: комментарий от Bad_ptr 13.01.13 10:58:01 MSK

Я так и не понял для чего флаг -mtune= ?

~~makeB~~
(13.01.13 11:27:44 MSK) автор топика

Ответ на: комментарий от makeB 13.01.13 11:27:44 MSK

Может, начнёшь читать маны?

~~Kindly_Cat~~ ☆
(13.01.13 11:28:56 MSK)

Ссылка

В общем написал так: -O2 -march=native -ftracer -mfpmath=sse -w -pipe

~~makeB~~
(13.01.13 11:44:37 MSK) автор топика

Ссылка

CFLAGS=" -march=core2 -mtune=core2 -O2 -pipe -mmmx -msse4.2 -ftracer -mfpmath=sse"

Ругайте.

ymuv ★★★★
(13.01.13 12:38:38 MSK)

Ответ на: комментарий от ymuv 13.01.13 12:38:38 MSK

Ругайте.

-mtune=core2 не нужен, зачем поддерживать младшее говно?

~~makeB~~
(13.01.13 13:26:51 MSK) автор топика

Ссылка

Ответ на: комментарий от Kindly_Cat 13.01.13 11:25:19 MSK

-fomit-frame-pointer

на десктопе тоже не лишний

Stil ★★★★★
(13.01.13 17:09:48 MSK)

Ответ на: комментарий от Stil 13.01.13 17:09:48 MSK

Включается автоматом в последних версиях gcc.

~~Kindly_Cat~~ ☆
(13.01.13 17:10:25 MSK)

Ссылка

Ответ на: комментарий от ymuv 13.01.13 12:38:38 MSK

-mtune не нужен - он и так по умолчанию равен значению -march
либо надо задавать его в generic - ибо быстрей
-mmmx тоже не нужен - он в составе -msse4.2
таки дела

megabaks ★★★★
(13.01.13 17:12:38 MSK)

core2 || native
/Кэп

megabaks ★★★★
(13.01.13 17:13:01 MSK)

Ссылка

Ответ на: комментарий от Bad_ptr 13.01.13 10:58:01 MSK

Сразу видно аналитега. '-O2' вместо '-Os' или '-Ofast', flto в помине нету, зато '-msse' и '-mmmx', которые автоматом включатся от native архитектуры, ffast-math, способный поломать некоторые программы, и очень спорный unroll-loops, который может как поднять, так и понизить производительность.

quiet_readonly ★★★★
(13.01.13 17:15:00 MSK)

Ответ на: комментарий от quiet_readonly 13.01.13 17:15:00 MSK

flto в помине нету

А надо?

~~Kindly_Cat~~ ☆
(13.01.13 17:15:43 MSK)

Ответ на: комментарий от Kindly_Cat 13.01.13 17:15:43 MSK

Вообще-то нет, сейчас рулит отзывчивость программы, а она флагами компилятора не улучшается (это у гентушников плацебо такое). Только concurrensy.

Но всегда приятно поиздеваться над людьми, верящими во флаги и не слышавшими про link time optimization, profile guided optimization и не знающими, почему в debian кое-где даже флаг -O2 не ставят.

quiet_readonly ★★★★
(13.01.13 17:17:48 MSK)
Последнее исправление: quiet_readonly 13.01.13 17:18:02 MSK (всего исправлений: 1)

Ответ на: комментарий от Kindly_Cat 13.01.13 17:15:43 MSK

flto в помине нету
А надо?

он бывает очень крут, но я его тестил только на своем, хотя «по идее» ломать ничего не должен

Stil ★★★★★
(13.01.13 17:19:39 MSK)

Ответ на: комментарий от quiet_readonly 13.01.13 17:15:00 MSK

Сразу видно аналитега. '-O2' вместо '-Os' или '-Ofast'
'-Ofast'
ffast-math, способный поломать некоторые программы

сам себе противоречишь
а -O2 пока что оптимальный уровень
матчасть поучил бы...

megabaks ★★★★
(13.01.13 17:21:48 MSK)

Ссылка

Ответ на: комментарий от quiet_readonly 13.01.13 17:17:48 MSK

offtopic

ты с scratchbox2 не работал? есть одна проблема с emulating mode

Stil ★★★★★
(13.01.13 17:22:27 MSK)

Ответ на: комментарий от Stil 13.01.13 17:19:39 MSK

это в теориии, а на приктике есть софт который с ним ты вообще не соберёшь

megabaks ★★★★
(13.01.13 17:24:17 MSK)

Ответ на: offtopic от Stil 13.01.13 17:22:27 MSK

offtopic to be continued

Нет, не работал.

quiet_readonly ★★★★
(13.01.13 17:27:11 MSK)

Ссылка

Ответ на: комментарий от megabaks 13.01.13 17:24:17 MSK

это в теориии, а на приктике есть софт который с ним ты вообще не соберёшь

И это подтверждает мою точку зрения, что включением lto и profile-guided optimization должны заниматься авторы софта, равно как и пакетированием. К сожалению, им тут сплошные препоны ставят - и в gcc куча багов всплывает при агрессивных оптимизациях, и пакеты требуют спек на не пойми каком языке, и системы сборки далеко не интуитивно понятны.

quiet_readonly ★★★★
(13.01.13 17:29:08 MSK)

Ответ на: комментарий от Bad_ptr 13.01.13 10:58:01 MSK

sqlite уже научилось понимать -ffast-math ? Чоловик пойдет собирать фокс и фигвам

nirolov
(13.01.13 17:37:06 MSK)

Ответ на: комментарий от quiet_readonly 13.01.13 17:29:08 MSK

И это подтверждает мою точку зрения, что включением lto и profile-guided optimization должны заниматься авторы софта

согласен

равно как и пакетированием

мне винда не нужна
я сам знаю с какими опциями собрать пакет
если они будут выкладывать сборки типа minimal_gtk2, minimal_gtk3, full_version и прочие ВСЕвозможные комбинации, аля гента, то согласен
иначе это будет фарш

megabaks ★★★★
(13.01.13 17:38:41 MSK)

Ссылка

Ответ на: комментарий от quiet_readonly 13.01.13 17:15:00 MSK

зато '-msse' и '-mmmx', которые автоматом включатся от native архитектуры

Это с какой версии гцц они стали включаться автоматом ?

nirolov
(13.01.13 17:39:00 MSK)

Ответ на: комментарий от nirolov 13.01.13 17:39:00 MSK

man gcc
с помощью -msse* ты можешь только задать поддерживаемые симды, если они не заданы в -march=*
поясню:

core2
               Intel Core2 CPU with 64-bit extensions, MMX, SSE, SSE2, SSE3 and SSSE3 instruction set support.

а моя корка (точнее уже quad) поддерживает ещё и sse4_1, потому у меня задан ещё и -msse4.1
сделано это для того, чтобы охватить инструкции, которые поддерживают все корки (в данном случае)
надеюсь понятно разжевал

megabaks ★★★★
(13.01.13 17:42:49 MSK)

Ответ на: комментарий от megabaks 13.01.13 17:42:49 MSK

Ни черта непонятно. Насколько помню native не включал автоматом вообще никакие mmx и sse

nirolov
(13.01.13 17:45:28 MSK)

Ответ на: комментарий от Bad_ptr 13.01.13 10:58:01 MSK

не все корки поддерживают sse4_1
mmx избыточен в данном случае аж 2 раза: native + -msse4.1
ffast-math ломает кучу софта, а вторую заставляет работать медленнее - привет, архиваторы
фанролл так же может довольно нехило тормознуть софт
инлайн аналогично
векторизация тоже иной раз болеет этим
короче, из твоего я бы оставил только: -O2 -pipe -march=native -mtune=generic -msse4.1 -mcx16 -msahf -mfpmath=sse -fomit-frame-pointer
если 64
в случае 32 убрать ещё и -mcx16 -msahf
ах да -fomit-frame-pointer только на мультилибе разве что может быть полезен, если брать 64

megabaks ★★★★
(13.01.13 17:48:14 MSK)
Последнее исправление: megabaks 13.01.13 17:49:31 MSK (всего исправлений: 2)

Ответ на: комментарий от nirolov 13.01.13 17:45:28 MSK

включает на самом деле

echo "int main() { return 0; }" |LANG=en gcc -march=core2 -v -Q -x c - 2>&1
....
 -mfancy-math-387 -mfp-ret-in-387 -mglibc -mieee-fp -mmmx -mno-red-zone
 -mno-sse4 -mpush-args -msahf -msse -msse2 -msse3 -mssse3
 -mtls-direct-seg-refs
...

echo "int main() { return 0; }" |LANG=en gcc -march=native -v -Q -x c - 2>&1
....
 -mfancy-math-387 -mfp-ret-in-387 -mglibc -mieee-fp -mmmx -mno-red-zone
 -mpush-args -msahf -msse -msse2 -msse3 -msse4.1 -mssse3
 -mtls-direct-seg-refs
....

megabaks ★★★★
(13.01.13 17:54:08 MSK)

Ответ на: комментарий от white_ghost 13.01.13 11:23:56 MSK

не всегда натив годится: привет, distcc

megabaks ★★★★
(13.01.13 17:59:26 MSK)

Ссылка

Ответ на: комментарий от quiet_readonly 13.01.13 17:15:00 MSK

Сразу видно аналитега.

сразу видно зубрилу флагов компеляции. :)
я это скопировал откуда-то из интернета. Но спасибо за подсказки.

Bad_ptr ★★★★★
(13.01.13 18:04:25 MSK)

Ссылка

Ответ на: комментарий от megabaks 13.01.13 17:48:14 MSK

и тебе спасибо

Bad_ptr ★★★★★
(13.01.13 18:06:05 MSK)

Ссылка

Ответ на: комментарий от megabaks 13.01.13 17:54:08 MSK

Гм, thanks, не знал

nirolov
(13.01.13 18:07:17 MSK)

Ссылка

Ответ на: комментарий от nirolov 13.01.13 17:37:06 MSK

sqlite уже научилось понимать -ffast-math ? Чоловик пойдет собирать фокс и фигвам

ну так пусть головой научится думать, что если чего-то не собирается, то надо попробовать без всяких там оптимизаций собрать

Bad_ptr ★★★★★
(13.01.13 18:07:42 MSK)

Ссылка

Ответ на: комментарий от nirolov 13.01.13 17:45:28 MSK

На хабрахабре в блоге интел писали, что в 64-битных системах sse вообще всегда включено, потому что не бывает x64 процессоров без sse.

quiet_readonly ★★★★
(13.01.13 18:24:26 MSK)

Ссылка

Ответ на: комментарий от megabaks 13.01.13 17:12:38 MSK

CFLAGS=" -march=core2 -mtune=core2 -O2 -pipe -mmmx -msse4.2 -ftracer -mfpmath=sse"

тоже

CFLAGS=" -march=core2 -O2 -pipe -msse4.2 -ftracer -mfpmath=sse"

для 3-7-ого корка:

CFLAGS="-march=corei7 -O2 -pipe -msse4.2 -ftracer -mfpmath=sse"

И да, давно волнующий вопрос, на который я не нашел ответа: какую mfpmath лучше писать (лучше в плане быстродействия)

-mfpmath=sse
-mfpmath=sse,387

?

ymuv ★★★★
(13.01.13 19:12:14 MSK)

Ответ на: комментарий от ymuv 13.01.13 19:12:14 MSK

потестируй
я использую первое
Сильвия, емнип, предпочитала второе

megabaks ★★★★
(13.01.13 19:17:06 MSK)

Ответ на: комментарий от ymuv 13.01.13 19:12:14 MSK

mfpmath=both. Регрессий нет, а вот профиг местами раза в 2-3 бывает.

devl547 ★★★★★
(13.01.13 19:21:59 MSK)

Ссылка

man gcc

anonymous
(13.01.13 19:33:12 MSK)

Ссылка

Ответ на: комментарий от megabaks 13.01.13 19:17:06 MSK

Сильвия, емнип, предпочитала второе

У неё отношение к оптимизации было, как к складскому учёту: пять штук продвинутых инструкций в маш.коде автоматически делает его лучше, чем две штуки таких инструкций. Где они там в этом коде находятся и что конкретно делают - ниипёт.

mv ★★★★★
(13.01.13 20:29:55 MSK)

Ответ на: комментарий от mv 13.01.13 20:29:55 MSK

ты что-то путаешь

megabaks ★★★★
(13.01.13 20:31:14 MSK)

Ответ на: комментарий от megabaks 13.01.13 20:31:14 MSK

nope. Она даже программульку для этого самого складского учёта наваяла ;)

mv ★★★★★
(13.01.13 21:11:10 MSK)
Последнее исправление: mv 13.01.13 21:11:41 MSK (всего исправлений: 1)

Ответ на: комментарий от mv 13.01.13 21:11:10 MSK

считалочка была только для того, чтобы выяснить и показать на практике какие ключи что дают и как в каких случаях работают

megabaks ★★★★
(13.01.13 21:12:37 MSK)

Ссылка

offtopic

offtopic to be continued

Похожие темы