LINUX.ORG.RU
ФорумTalks

А вот как Интель добивается «превосходства» в некоторых программах

 , , ,


2

2

https://3dnews.ru/997915

На Реддите выложили рецепты, как отучить Matlab проверять производителя процессора. Это позволяет задействовать на AMD весь набор инструкций типа SSE и AVX, что поднимает производительность до 3 раз. «Искаропки» же Matlab использует на не-Интеловских процессорах только SSE1

Deleted

Даже из-под виртуалки на ARMе? Ужас какой.

tiinn ★★★ ()

Так кто виноват-то? Intel или разработчики Matlab?

Korchevatel ★★★★ ()

что поднимает производительность до 3 раз

А 2+2 при этом будет равно 4?

no-such-file ★★★★★ ()
Ответ на: комментарий от no-such-file

Сказано же, до 3 раз.

Если процессор мощный, может и аж 12 выдать.

karton1 ★★★★ ()
Ответ на: комментарий от karton1

Я понимаю, что в военное время синус может равняться чему угодно. Вопрос в том, можно ли доверять получаемым результатам вычислений?

no-such-file ★★★★★ ()
Ответ на: комментарий от no-such-file

Если без шуток, то хороший вопрос. Мб там округление менее точным до этого было на AMD и тд.

karton1 ★★★★ ()

у меня дежавю, было же что-то похожее с интеловским компилятором

WerNA ★★★★★ ()
Ответ на: комментарий от karton1

Векторизация ошибок не добавит, просто циклы будут быстрее выполняться и всё, не знаю конечно как внутри Матлаба это организовано. Может просто тестиили на интеловских процах и решили не рисковать? А вот OpenMP на криво распараллеленном коде запросто может показывать разные результаты на разных процах, сам недавно наблюдал когда забыл переменным атрибут private указать. На старом коре2дуо в два потока тестил и не заметил ошибки, а разница в результате вылезла на 4 потоках у 4790K ну и ессно на дуал Xeon с 28 ядрами.

WerNA ★★★★★ ()
Последнее исправление: WerNA (всего исправлений: 1)

«Как отучить Matlab» звучит так, как будто Matlab специально дискриминирует процессоры AMD. Но дискриминацией занимается MKL, а не Matlab.

seiken ★★★★★ ()

«Искаропки» же Matlab использует на не-Интеловских процессорах только SSE1

Типичная, продажная проприетарь. Даже не удивлён.

С другой стороны, гугловская либа Skia работает почти в 3 раза быстрее, если собрана через clang, а не gcc. Так что спасенья нет.

RazrFalcon ★★★★★ ()
Ответ на: комментарий от WerNA

у меня дежавю, было же что-то похожее с интеловским компилятором

seiken

как будто Matlab специально дискриминирует процессоры AMD. Но дискриминацией занимается MKL

Я конечно все понимаю, но почему проприетарные продукты интел должны быть оптимизированы под чужие процессоры? Интел содержит программистов вкладывает в разработку софта деньги, амд то почему все это должен бесплатно получать.

uin ★★★ ()
Ответ на: комментарий от uin

Я конечно все понимаю, но почему проприетарные продукты интел должны быть оптимизированы под чужие процессоры?

А про это и речи не идет, пусть под свои процессоры оптимизируют как хотят. Но в данном случае под остальные процессоры создается заведомо медленный код, не смотря на то что они могут спокойно выполнять оптимизированный код.

V1KT0P ★★ ()
Ответ на: комментарий от uin

Я конечно все понимаю, но почему проприетарные продукты интел должны быть оптимизированы под чужие процессоры?

Абсолютно не обязаны. Если бы я работал на интел, я бы даже специально так имплементил, чтобы на АМД тормозило побольше. Другое дело, что матлабовцы могли бы все эти настройки из статьи сами в своих дистрибутивах применить. Но вобщем, они тоже по большому счету не обязаны. Ради оптимизации для маргинальных процессоров может и не быть ресурсов.

seiken ★★★★★ ()
Ответ на: комментарий от seiken

Если бы я работал на интел, я бы даже специально так имплементил, чтобы на АМД тормозило побольше.

Пссс… по слухам, в Н. Новгороде и Новосибе с кадрами как-то не очень хорошо обращаются.

DarkAmateur ★★ ()
Ответ на: комментарий от seiken

Если бы я работал на интел, я бы даже специально так имплементил, чтобы на АМД тормозило побольше.

если это докажут в суде, то тебе крышка

stevejobs ★★★★☆ ()

Это позволяет задействовать на AMD весь набор инструкций типа SSE и AVX, что поднимает производительность до 3 раз.

Лол.

Как-то я не замечал, надо обратить внимание и попробовать.

curufinwe ★★★★★ ()
Ответ на: комментарий от V1KT0P

Но в данном случае под остальные процессоры создается заведомо медленный код

Там просто не задействуется автовекторизация насколько я понимаю. Это ведь не такая простая оптимизация как инлайнинг какой нибудь, это ведь надо хитро цикл расплести на независимые операнды, и тут такие амд/виа «мы векторных регистров натыркали, нам тожа здэлай давай па братски, красыва»

uin ★★★ ()

проприетарный софт нас необманет

takino ★★★★ ()
Ответ на: комментарий от uin

Там просто не задействуется автовекторизация

На сколько мне известно, это фишка компилятора.

DarkAmateur ★★ ()
Ответ на: комментарий от DarkAmateur

Ну так и? Говори сразу к чему клонишь.

uin ★★★ ()
Ответ на: комментарий от uin

Машинный код либо попадает в систему команд, либо нет. В данном случае речь идёт о том, что попадает и медвежья услуга со стороны Интеля не нужна. От неё достаточно фразы «на AMD даже не тестировали и не запускали, всё на Ваш страх и риск.» Всё.

DarkAmateur ★★ ()
Ответ на: комментарий от uin

Вообще, генерить говно под non-Intel интеловскими компилерами — отдельный цирк.

DarkAmateur ★★ ()
Ответ на: комментарий от DarkAmateur

медвежья услуга со стороны Интеля не нужна

Ну так он ее и не оказывает - «вектаризуйте, мол руками»

Вообще, генерить говно под non-Intel интеловскими компилерами — отдельный цирк.

Вообще у них там на североамериканских западах с давних времен вот это вот все практикуется, вон хоть на эпл тот же посмотреть.

uin ★★★ ()
Последнее исправление: uin (всего исправлений: 1)
Ответ на: комментарий от Deleted

набрось для начала галочку лоркода в настройках своего профиля.

deep-purple ★★★★★ ()
Ответ на: комментарий от RazrFalcon

гугловская либа Skia работает почти в 3 раза быстрее, если собрана через clang, а не gcc

можно пруф?

Kompilainenn ★★★★★ ()
Ответ на: комментарий от RazrFalcon

С другой стороны, гугловская либа Skia работает почти в 3 раза быстрее, если собрана через clang, а не gcc. Так что спасенья нет.

Хром получается выгоднее clang-ом собирать? :)

Впрочем неудивительно, они сейчас даже на Android не пользуются GCC. Даже для сборки ядра.

В моих личных тестах кстати clang с -mllvm -polly обходит GCC -fgraphite-identity.

a1batross ★★★★★ ()
Последнее исправление: a1batross (всего исправлений: 1)
Ответ на: комментарий от a1batross

Хром получается выгоднее clang-ом собирать?

Хром вообще хитрый фрукт. Как я его (хромиум) не собирал на генту - он всегда медленнее бинарника. Возможно нужно повозится и собрать через clang.

С другой стороны у лисы есть lto и pgo use-флаги, и она с ними на 30-40% быстрее.

RazrFalcon ★★★★★ ()
Ответ на: комментарий от RazrFalcon

«gcc не виноват, просто мы решили оптимизировать под шланг»

INFOMAN ★★★★★ ()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)