[loroogle] icc

0

1

заинтересовался icc
потестил на bzip2 - на распаковке профит ~14% на упаковке >30%
мне это нравится :)
но т.к. icc может собрать далеко не всё и вся или собрать так, что оно работать не будет, например lzma&co, возник вопрос - есть ли список софта, нормально собирающийся с icc и работающий?
или кто что им собирал?
гуголь не колется
встретил только несколько пакетов, которые собирать им просто не рекомендуется - это ncurses,zlib,glibc,stdc++ и прочие

Ссылка

← старый русифицированный старик brood war под wine

Свободное ПО обходится российским школам дороже лицензионного →

← 1 2 3 4 →

Ответ на: комментарий от devl547 04.09.10 20:41:46 MSK

хорошо, я вообщем-то больше для себя написала,
у гентушников есть похожий скрипт на перле, но без ssse3 и работает он дико медленно ( в 60 раз медленнее )

Sylvia ★★★★★
(04.09.10 20:43:13 MSK)

Ссылка

Ответ на: комментарий от Sylvia 04.09.10 20:40:06 MSK

На objdump в качестве дизассемблера не всегда возможно полагаться.
У меня так(x86_64):

$ objdump -d /bin/bash |grep cpuid | wc -l
0

Да и откуда в баше взяться cpuid? )

~~anon_666~~ ★
(04.09.10 20:44:55 MSK)

Ответ на: комментарий от anon_666 04.09.10 20:44:55 MSK

у меня bash собран icc , он всегда использует cpuid

objdump в качестве дизассемблера не всегда возможно полагаться.

предложите вариант лучше (и не менее доступный чем objdump из стандартного комплекта binutils)

Sylvia ★★★★★
(04.09.10 20:49:52 MSK)

Ответ на: комментарий от Sylvia 04.09.10 20:49:52 MSK

Я так сходу не предложу, но библиотек-дизассемблеров под x86(_64) валом.

~~anon_666~~ ★
(04.09.10 20:52:52 MSK)

Ссылка

С правильными флагами GCC делает ICC почти во всех тестах.

Тьфу на вас.

Ради интереса потестируйте unrar, собранный GCC, и попробуйте собрать более быстрый unrar с помощью ICC. Ничего у вас не получится :)

Брать оптимизированный unrar здесь.

~~tempuser002~~ ★
(04.09.10 21:53:56 MSK)

Ответ на: комментарий от tempuser002 04.09.10 21:53:56 MSK

на 64 или на 32?

megabaks ★★★★
(04.09.10 21:54:53 MSK) автор топика

Ссылка

Ответ на: комментарий от tempuser002 04.09.10 21:53:56 MSK

можно я еще раз напишу, что неинтересны моменты того что:

1) un (интереснее упаковщик, чем распаковщик)
2) rar (я предпочитаю совсем другие форматы - 7z , zip)
3) бинарник с неизвестного источника (может там с профилером сидел кто-то и на асм переписывал, а может и бяку всунули попутно)

Sylvia ★★★★★
(04.09.10 21:57:16 MSK)

Ответ на: комментарий от tempuser002 04.09.10 21:53:56 MSK

>С правильными флагами GCC делает ICC почти во всех тестах.

Вот сиди и проверяй каждый флаг через Acovea и для каждой проги.
А мне было достаточно пересобрать icc и получить прирост скорости.

попробуйте собрать более быстрый unrar с помощью ICC.

Давай. Соберу unrar c icc, pgo, под 64 бита и под свой конкретный проц.

Ничего у вас не получится :)

троллить только так не надо

devl547 ★★★★★
(04.09.10 22:07:44 MSK)

Ответ на: комментарий от devl547 04.09.10 22:07:44 MSK

я кстати еще добавлю, компиляторы сравниваются не по одной программе,
а то тут p7zip мучали, кто-то там на хабре с povray бенчмарки делал, всегда есть как положительные результаты, так и отставание в чем-то,
так что перед тем как выбирать ICC как компилятор для чего-то, нужно определиться а стоит ли затрачивать на это время?

некоторые пакеты могут даже отключать оптимизированный MMX/SSE asm код, в случае если используется «неподдерживаемый» компилятор

Sylvia ★★★★★
(04.09.10 22:20:34 MSK)

Ответ на: комментарий от devl547 04.09.10 22:07:44 MSK

с того сайта:

real 0m33.715s
user 0m5.772s
sys 0m0.060s

мой, собран gcc:

real 0m33.762s
user 0m5.772s
sys 0m0.058s

мой, собран icc:

real 0m32.815s
user 0m5.600s
sys 0m0.040s

devl547 ★★★★★
(04.09.10 22:42:39 MSK)

Ответ на: комментарий от devl547 04.09.10 22:42:39 MSK

P.S. where is your god now?

devl547 ★★★★★
(04.09.10 22:43:02 MSK)

Ответ на: комментарий от Sylvia 04.09.10 22:20:34 MSK

>так что перед тем как выбирать ICC как компилятор для чего-то, нужно определиться а стоит ли затрачивать на это время?

естественно, не стоит собирать им нересурсоемкую мелочь

некоторые пакеты могут даже отключать оптимизированный MMX/SSE asm код, в случае если используется «неподдерживаемый» компилятор

видать защита от MSVC, у которого другой диалект асма :)

а вообще, по дефайнам gcc и icpc отличить не так уж просто, стараться надо

annulen ★★★★★
(04.09.10 22:49:25 MSK)

Ссылка

Ответ на: комментарий от devl547 04.09.10 22:07:44 MSK

>Соберу unrar c icc, pgo, под 64 бита и под свой конкретный проц.

-ipo1 не забудь :)

для фаллометрических целей еще можно поколдовать с точность арифтметики с плавающей точкой

annulen ★★★★★
(04.09.10 22:50:44 MSK)

Ответ на: комментарий от annulen 04.09.10 22:50:44 MSK

ну зачем сразу над человеком то издеваться?

Глянь выше, я без особого шаманства обогнал его «super-puper-ultra-unrar»

devl547 ★★★★★
(04.09.10 22:52:37 MSK)

Ответ на: комментарий от devl547 04.09.10 22:52:37 MSK

-ftz козырный флаг,я гарантирую это

annulen ★★★★★
(04.09.10 22:56:45 MSK)

Ответ на: комментарий от Deleted 01.09.10 01:03:35 MSK

>Проприетарщина? :(

смотри и завидуй %)

annulen ★★★★★
(04.09.10 22:58:47 MSK)

Ответ на: комментарий от annulen 04.09.10 22:56:45 MSK

>This option flushes denormal results to zero

стремно что-то ))

devl547 ★★★★★
(04.09.10 23:10:10 MSK)

Ответ на: комментарий от devl547 04.09.10 22:52:37 MSK

>я без особого шаманства обогнал его «super-puper-ultra-unrar»

в числодробильне часто требуется добиться максимальной производительности, а это несколько сложнее, чем обогнать gcc/gfortran :)

annulen ★★★★★
(04.09.10 23:11:17 MSK)

Ссылка

Ответ на: комментарий от devl547 04.09.10 23:10:10 MSK

>стремно что-то ))

нормал, в числодробильне используется. на всякие там IEEE-совместимости можно класть :)

annulen ★★★★★
(04.09.10 23:12:13 MSK)

Ссылка

Ответ на: комментарий от annulen 04.09.10 22:56:45 MSK

а ещё козырных флагов накидать?
самому долго выискивать

megabaks ★★★★
(05.09.10 01:24:44 MSK) автор топика

Ответ на: комментарий от megabaks 05.09.10 01:24:44 MSK

параллелицазия с использованием OpenMP: -openmp (но для этого нужны OpenMP директивы в коде, а в GCC это появилось недавно)

можно еще автопараллелизацию попробовать: -parallel но профит не гарантирован.

annulen ★★★★★
(05.09.10 14:01:45 MSK)

Ответ на: комментарий от annulen 04.09.10 22:58:47 MSK

Завидовать глюкам? Ну уж нет, вот когда весь софт будут проверят на предмет копиляции icc, тогда ещё можно будет.

Deleted
(05.09.10 14:06:36 MSK)

Ответ на: комментарий от Sylvia 04.09.10 21:57:16 MSK

Вика, замучила ты меня уже.

Погляди у страницы автора, нет там никаких backdoors.

Можешь sudo на nobody сделать у бинарника, чтобы меня не смешить.

бинарники там для x86.

~~tempuser002~~ ★
(05.09.10 14:13:14 MSK)

Ссылка

Ответ на: комментарий от devl547 04.09.10 22:43:02 MSK

какой-то несжимаемый файл распаковывали? попробуйте что-то нормальное.

~~tempuser002~~ ★
(05.09.10 14:14:22 MSK)

Ответ на: комментарий от Deleted 05.09.10 14:06:36 MSK

>вот когда весь софт будут проверят на предмет копиляции icc

нормальные разработчики без GNU головного мозга обычно проверяют

annulen ★★★★★
(05.09.10 14:16:07 MSK)

Ссылка

Ответ на: комментарий от tempuser002 05.09.10 14:14:22 MSK

>какой-то несжимаемый файл распаковывали?

Сжатие в 3 раза - это теперь «несжимаемый»?

devl547 ★★★★★
(05.09.10 14:35:41 MSK)

Ответ на: комментарий от devl547 05.09.10 14:35:41 MSK

С*ранно. У меня ICC получается на 20% медленней.

Да и при ваших результатах ICC никак не смотрится круче. ;)

А ведь он оптимизирует как будто до упора.

~~tempuser002~~ ★
(05.09.10 22:21:11 MSK)

Ответ на: комментарий от tempuser002 05.09.10 22:21:11 MSK

>У меня ICC получается на 20% медленней.

Опции компилятора где?

~~anon_666~~ ★
(05.09.10 22:47:18 MSK)

Ссылка

Ответ на: комментарий от tempuser002 05.09.10 22:21:11 MSK

>А ведь он оптимизирует как будто до упора.

Тут никто не оптимизировал до упора.
-march=core2 -msse4 -O3 -ffast-math -g0 --param l2-cache-size 256 для GCC
и -xSSE4.2 -O3 -gcc -fp-model fast=2 -no-prec-div для icc

prefetch, графиты, все остальные оптимизации - не включались.

devl547 ★★★★★
(05.09.10 23:06:58 MSK)

Ответ на: комментарий от annulen 05.09.10 14:01:45 MSK

>автопараллелизацию попробовать: -parallel
это не настолько же страшно, как -floop-parallelize-all -ftree-parallelize-loops=n ?

megabaks ★★★★
(05.09.10 23:54:08 MSK) автор топика

Ответ на: комментарий от megabaks 05.09.10 23:54:08 MSK

не особенно страшно, но практически бесполезно, паралеллит на программу небольшого размера всего несколько циклов, прироста производительности почти нет, в отместку линкуются лишние библиотеки ...

Sylvia ★★★★★
(05.09.10 23:56:01 MSK)

Ответ на: комментарий от devl547 05.09.10 23:06:58 MSK

>prefetch
есть что покурить?
по-русски желательно

megabaks ★★★★
(05.09.10 23:56:35 MSK) автор топика

Ответ на: комментарий от devl547 05.09.10 23:06:58 MSK

>графит

ЕМНИП, графит только скорость компиляции увеличивает :)

annulen ★★★★★
(05.09.10 23:57:21 MSK)

Ответ на: комментарий от devl547 05.09.10 23:06:58 MSK

и да - обработай аву )
белые артефакты в виде ауры не айс

megabaks ★★★★
(05.09.10 23:57:39 MSK) автор топика

Ответ на: комментарий от annulen 05.09.10 23:57:21 MSK

не-не-не
графит скорость компиляции уменьшает раза эдак в 1.5-2 (на примере хромиума)
это оптимизатор циклов - развороты-паралеллизация и прочее

megabaks ★★★★
(05.09.10 23:58:54 MSK) автор топика

Ссылка

Ответ на: комментарий от megabaks 05.09.10 23:57:39 MSK

>белые артефакты в виде ауры не айс

Считай это фичей)) Лениво пока этим заниматься, я go-oo под slitaz собираю.

devl547 ★★★★★
(05.09.10 23:59:26 MSK)

Ссылка

Ответ на: комментарий от devl547 05.09.10 23:06:58 MSK

> -xSSE4.2

FYI, в 11ом есть такая штука -xHost

annulen ★★★★★
(05.09.10 23:59:39 MSK)

Ответ на: комментарий от annulen 05.09.10 23:59:39 MSK

аналог -march=native ?
если да - не нужно

megabaks ★★★★
(06.09.10 00:01:04 MSK) автор топика

Ответ на: комментарий от megabaks 05.09.10 23:56:35 MSK

>есть что покурить?

донской) и документацию.
http://software.intel.com/en-us/articles/use-software-data-prefetch-on-32-bit...
http://software.intel.com/en-us/articles/optimize-prefetch-on-32-bit-intel-ar...
http://software.intel.com/en-us/articles/how-to-choose-between-hardware-and-s...

devl547 ★★★★★
(06.09.10 00:01:13 MSK)

Ответ на: комментарий от annulen 05.09.10 23:59:39 MSK

>-xHost

Читал. Как-то не впечатлился. Разницы с xSSE4.2 вроде нет.

devl547 ★★★★★
(06.09.10 00:02:12 MSK)

Ссылка

Ответ на: комментарий от devl547 06.09.10 00:01:13 MSK

так - и много профита даёт?

megabaks ★★★★
(06.09.10 00:09:08 MSK) автор топика

Ответ на: комментарий от Sylvia 05.09.10 23:56:01 MSK

т.е. даже шшупать не стОит? :)

megabaks ★★★★
(06.09.10 00:15:46 MSK) автор топика

Ссылка

Ответ на: комментарий от megabaks 06.09.10 00:09:08 MSK

>и много профита даёт?

Много. Если вручную лопатить код в поисках узких мест.

devl547 ★★★★★
(06.09.10 00:16:43 MSK)

Ответ на: комментарий от devl547 06.09.10 00:16:43 MSK

>вручную лопатить код в поисках узких мест
тьфу - уж лучше тогда переписывать )

megabaks ★★★★
(06.09.10 00:19:09 MSK) автор топика

Ответ на: комментарий от megabaks 06.09.10 00:19:09 MSK

>уж лучше тогда переписывать

как вариант) но в этом случае придется переписать половину юзерспейса ибо тормозит)

devl547 ★★★★★
(06.09.10 00:20:27 MSK)

Ответ на: комментарий от devl547 06.09.10 00:20:27 MSK

так - ты мне лучше скажи вот что
тупо натыкать флажков(не раскуривая кода) может дать профит/регресс?

megabaks ★★★★
(06.09.10 00:21:44 MSK) автор топика

Ответ на: комментарий от megabaks 06.09.10 00:21:44 MSK

Может как профит (если шина простаивает), так и регресс (если шина и так забита данными)

devl547 ★★★★★
(06.09.10 00:23:37 MSK)

Ответ на: комментарий от devl547 06.09.10 00:23:37 MSK

Если кратко:
Вместо посчитали-загрузили из памяти-посчитали-и.т.д. будет
запустили префетч-посчитали-посчитали-посчитали (а данные для следующей итерации цикла будут грузиться заранее)

devl547 ★★★★★
(06.09.10 00:25:39 MSK)

Ответ на: комментарий от devl547 06.09.10 00:25:39 MSK

а теперь не по-древне_индейски
чем должен заниматься софт для получения профита от prefetch?

megabaks ★★★★
(06.09.10 00:27:53 MSK) автор топика

Ответ на: комментарий от megabaks 06.09.10 00:27:53 MSK

Любой числодробильней с относительно большими обьемами данных и упорядоченными запросами в циклах. Не знаю, как с архиваторами, но кодеки и графические либы точно в плюсе.

devl547 ★★★★★
(06.09.10 00:29:44 MSK)

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 4 →

← старый русифицированный старик brood war под wine

Talks

Свободное ПО обходится российским школам дороже лицензионного →

Похожие темы