LINUX.ORG.RU
ФорумTalks

А вот как Интель добивается «превосходства» в некоторых программах

 , , ,


2

2

https://3dnews.ru/997915

На Реддите выложили рецепты, как отучить Matlab проверять производителя процессора. Это позволяет задействовать на AMD весь набор инструкций типа SSE и AVX, что поднимает производительность до 3 раз. «Искаропки» же Matlab использует на не-Интеловских процессорах только SSE1

Deleted

Даже из-под виртуалки на ARMе? Ужас какой.

tiinn ★★★★★
()
Ответ на: комментарий от karton1

Я понимаю, что в военное время синус может равняться чему угодно. Вопрос в том, можно ли доверять получаемым результатам вычислений?

no-such-file ★★★★★
()
Ответ на: комментарий от karton1

Векторизация ошибок не добавит, просто циклы будут быстрее выполняться и всё, не знаю конечно как внутри Матлаба это организовано. Может просто тестиили на интеловских процах и решили не рисковать? А вот OpenMP на криво распараллеленном коде запросто может показывать разные результаты на разных процах, сам недавно наблюдал когда забыл переменным атрибут private указать. На старом коре2дуо в два потока тестил и не заметил ошибки, а разница в результате вылезла на 4 потоках у 4790K ну и ессно на дуал Xeon с 28 ядрами.

WerNA ★★★★★
()
Последнее исправление: WerNA (всего исправлений: 1)

«Как отучить Matlab» звучит так, как будто Matlab специально дискриминирует процессоры AMD. Но дискриминацией занимается MKL, а не Matlab.

seiken ★★★★★
()

«Искаропки» же Matlab использует на не-Интеловских процессорах только SSE1

Типичная, продажная проприетарь. Даже не удивлён.

С другой стороны, гугловская либа Skia работает почти в 3 раза быстрее, если собрана через clang, а не gcc. Так что спасенья нет.

RazrFalcon ★★★★★
()
Ответ на: комментарий от WerNA

у меня дежавю, было же что-то похожее с интеловским компилятором

seiken

как будто Matlab специально дискриминирует процессоры AMD. Но дискриминацией занимается MKL

Я конечно все понимаю, но почему проприетарные продукты интел должны быть оптимизированы под чужие процессоры? Интел содержит программистов вкладывает в разработку софта деньги, амд то почему все это должен бесплатно получать.

uin ★★★
()
Ответ на: комментарий от uin

Я конечно все понимаю, но почему проприетарные продукты интел должны быть оптимизированы под чужие процессоры?

А про это и речи не идет, пусть под свои процессоры оптимизируют как хотят. Но в данном случае под остальные процессоры создается заведомо медленный код, не смотря на то что они могут спокойно выполнять оптимизированный код.

V1KT0P ★★
()
Ответ на: комментарий от uin

Я конечно все понимаю, но почему проприетарные продукты интел должны быть оптимизированы под чужие процессоры?

Абсолютно не обязаны. Если бы я работал на интел, я бы даже специально так имплементил, чтобы на АМД тормозило побольше. Другое дело, что матлабовцы могли бы все эти настройки из статьи сами в своих дистрибутивах применить. Но вобщем, они тоже по большому счету не обязаны. Ради оптимизации для маргинальных процессоров может и не быть ресурсов.

seiken ★★★★★
()
Ответ на: комментарий от seiken

Если бы я работал на интел, я бы даже специально так имплементил, чтобы на АМД тормозило побольше.

Пссс… по слухам, в Н. Новгороде и Новосибе с кадрами как-то не очень хорошо обращаются.

DarkAmateur ★★★
()
Ответ на: комментарий от seiken

Если бы я работал на интел, я бы даже специально так имплементил, чтобы на АМД тормозило побольше.

если это докажут в суде, то тебе крышка

stevejobs ★★★★☆
()

Это позволяет задействовать на AMD весь набор инструкций типа SSE и AVX, что поднимает производительность до 3 раз.

Лол.

Как-то я не замечал, надо обратить внимание и попробовать.

curufinwe ★★★★★
()
Ответ на: комментарий от V1KT0P

Но в данном случае под остальные процессоры создается заведомо медленный код

Там просто не задействуется автовекторизация насколько я понимаю. Это ведь не такая простая оптимизация как инлайнинг какой нибудь, это ведь надо хитро цикл расплести на независимые операнды, и тут такие амд/виа «мы векторных регистров натыркали, нам тожа здэлай давай па братски, красыва»

uin ★★★
()

проприетарный софт нас необманет

takino ★★★★★
()
Ответ на: комментарий от uin

Машинный код либо попадает в систему команд, либо нет. В данном случае речь идёт о том, что попадает и медвежья услуга со стороны Интеля не нужна. От неё достаточно фразы «на AMD даже не тестировали и не запускали, всё на Ваш страх и риск.» Всё.

DarkAmateur ★★★
()
Ответ на: комментарий от uin

Вообще, генерить говно под non-Intel интеловскими компилерами — отдельный цирк.

DarkAmateur ★★★
()
Ответ на: комментарий от DarkAmateur

медвежья услуга со стороны Интеля не нужна

Ну так он ее и не оказывает - «вектаризуйте, мол руками»

Вообще, генерить говно под non-Intel интеловскими компилерами — отдельный цирк.

Вообще у них там на североамериканских западах с давних времен вот это вот все практикуется, вон хоть на эпл тот же посмотреть.

uin ★★★
()
Последнее исправление: uin (всего исправлений: 1)
Ответ на: комментарий от RazrFalcon

С другой стороны, гугловская либа Skia работает почти в 3 раза быстрее, если собрана через clang, а не gcc. Так что спасенья нет.

Хром получается выгоднее clang-ом собирать? :)

Впрочем неудивительно, они сейчас даже на Android не пользуются GCC. Даже для сборки ядра.

В моих личных тестах кстати clang с -mllvm -polly обходит GCC -fgraphite-identity.

a1batross ★★★★★
()
Последнее исправление: a1batross (всего исправлений: 1)
Ответ на: комментарий от a1batross

Хром получается выгоднее clang-ом собирать?

Хром вообще хитрый фрукт. Как я его (хромиум) не собирал на генту - он всегда медленнее бинарника. Возможно нужно повозится и собрать через clang.

С другой стороны у лисы есть lto и pgo use-флаги, и она с ними на 30-40% быстрее.

RazrFalcon ★★★★★
()
Ответ на: комментарий от RazrFalcon

«gcc не виноват, просто мы решили оптимизировать под шланг»

INFOMAN ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.