LINUX.ORG.RU
 
darkshvein

Оптимизация ПО для AMD «Bulldozer»


0

1

AMD опубликовала «Руководство по оптимизации ПО на 15h», архитектуре процессоров, также известной под кодовым именем «Bulldozer».

В руководстве рассказывается о:

  • микроархитектуре новых процессоров;
  • оптимизациях для C/C++;
  • главных 64-битных улучшениях;
  • оптимизациях для кеша/памяти;
  • оптимизации декодирования инструкций;
  • оптимизации планировщика;
  • улучшения безопасности VM;
  • оптимизации NUMA.

>>> Прямая ссылка на PDF


[#]  

ну наконец-то. надеюсь это в последствии уменьшит кол-во соплей о сливе бульдозера.

* ()
[#] Ответ на: комментарий от dib2 17.01.2012 1:01:42  
Thero

ну бульдозер слил только из-за маркетологов... которым хватило ума сказать что мы порвём жопу всему миру... пытаясь сесть в позу лотоса с разворота.. ну сели в позу лотоса и даже с разворота, но обещали то больше..

** ()
[#] Ответ на: комментарий от Thero 17.01.2012 1:33:10  
Thero

ну и в тринити пригодится!

** ()
[#]  

Такой период сейчас, что как и многие другие думаю чего брать интел или амд. Есть ли основания полагать, что со всеми оптимизациями под Linux бульдозеры 8150 будут быстрее или на сравнимом уровне с Intel 2600K ? Пока что даже самые благожелательные сравнения явно не в пользу AMD.

И насчёт отставания в плавучке бульдозеров по сравнению с феномами: не могу понять, это касается только x87-ого кода, который даже официально назван устаревшим, но в который ещё очень часто компилируют или и SSE2 тоже?

***** ()
[#]  
druganddrop-2

видел тред на первой странице

В тоже время у intel всё просто работает и не надо изобретать велосипеды при программирование под особенные процессоры. У амд ЧСВ величиной с Америку если думали, что ради них кроме кучки фанатиков кто то будет городить костыли. Позор выпускать было эти бульдозеры которые сливают даже древнем и медленным феномам, но уж если выпустили, то и стоить они должны как i3, а не как i7.

* ()
[#] Ответ на: комментарий от anonymous_incognito 17.01.2012 2:13:46  
tazhate
>>-----Цитата---->>

Есть ли основания полагать, что со всеми оптимизациями под Linux бульдозеры 8150 будут быстрее или на сравнимом уровне с Intel 2600K ?

<<-----Цитата----<<

на уровне реализации сейчас - сильно врядли.

***** ()
[#] Ответ на: комментарий от anonymous_incognito 17.01.2012 2:13:46  
tazhate
>>-----Цитата---->>

There are a few tests on which Bulldozer takes on Sandy Bridge well, such as those truly optimized for high core counts, but on single-core tasks it gets destroyed.

<<-----Цитата----<<

и такого счастья полон интернет.

***** ()
[#]  
ZuBB

В руководстве рассказывается о ...

  • главных 64бит улучшениях
  • улучшения безопасности VM

grammar_natsi.sepuku.gif

** ()
[#]  
x0r
>>-----Цитата---->>

для Ъ программистов

<<-----Цитата----<<

для разрабов трансляторов тащемта

** ()
[#] Ответ на: видел тред на первой странице от druganddrop-2 17.01.2012 2:18:06  
Napilnik
>>-----Цитата---->>

В тоже время у intel всё просто работает и не надо изобретать велосипеды при программирование под особенные процессоры.

<<-----Цитата----<<

Пишешь на ассемблере;)

>>-----Цитата---->>

У амд ЧСВ величиной с Америку если думали, что ради них кроме кучки фанатиков кто то будет городить костыли.

<<-----Цитата----<<

Программистам на высокоуровневых языках костыли и не понадобятся, почти всё подхватится само.

>>-----Цитата---->>

Позор выпускать было эти бульдозеры которые сливают даже древнем и медленным феномам

<<-----Цитата----<<

Предлагаешь оптимизировать компиляторы не имея необходимого железа для проверки?

*** ()
[#] Ответ на: видел тред на первой странице от druganddrop-2 17.01.2012 2:18:06  
ymuv

Re: видел тред на первой странице

>>-----Цитата---->>

кроме кучки фанатиков кто то будет городить костыли

<<-----Цитата----<<

Я сомневаюсь что вообще костыли будут где-нибудь городить кроме как в компиляторе.

>>-----Цитата---->>

видел тред на первой странице

<<-----Цитата----<<

Сомневаюсь что тред будет большим 3-5 страниц.

* ()
[#]  
true_admin

Ребят, это всё хорошо, но в реальности проще купить проц что из коробки работает быстрее чем костыли и затычки пихать. Просто потому что 1) время программиста дороже выйде 2) не бульдозером единым 3) кто сказал что под интел нет оптимизаций?

Ну и никого не смущает что там 360 страниц? Правда там очень много процесоро-независимых оптимизиций. Т.е. при попытке ускорится под бульдозер может запросто выяснитьсяя что на интеле оно тоже стало быстрее. Во всяком случае оптимизации под кэши, использование векторных инструкций итп подходят под любой процессор.

А ещё там много ассемблера. Это хорошо для описания сути происходящего, но как часто мы видим ассемблер в боевых проектах?

Короче, статья вроде неплохая, но мир она не изменит т.к. 1) кто НАСТОЛЬКО заморачивается скоростью это всё давно знает 2) вряд ли все ломануться переписывать существующий код.

***** ()
[#] Ответ на: комментарий от true_admin 17.01.2012 3:39:41  
>>-----Цитата---->>

А ещё там много ассемблера. Это хорошо для описания сути происходящего, но как часто мы видим ассемблер в боевых проектах?

<<-----Цитата----<<
>>-----Цитата---->>

Короче, статья вроде неплохая, но мир она не изменит т.к. 1) кто НАСТОЛЬКО заморачивается скоростью это всё давно знает 2) вряд ли все ломануться переписывать существующий код.

<<-----Цитата----<<

Так небось это статья для авторов gcc и прочих компиляторов, т.е. никаких изменений никому, кроме них, делать не придётся. Потому и ассемблер.

anonymous ()
[#] Ответ на: комментарий от anonymous 17.01.2012 4:18:46  
>>-----Цитата---->>

Так небось это статья для авторов gcc и прочих компиляторов, т.е. никаких изменений никому, кроме них, делать не придётся. Потому и ассемблер.

<<-----Цитата----<<

И, кстати, из этого следует, что бинарные дистрибутивы со своими пакетами под сферические архитектуры в вакууме будут сливать. Владельцам бульдозера придётся ставить генту, хы.

anonymous ()
[#] Ответ на: комментарий от anonymous 17.01.2012 4:18:46  
true_admin

> для авторов gcc и прочих компиляторов

Ну чтож, будем надеяться это даст плоды.

***** ()
[#] Ответ на: комментарий от true_admin 17.01.2012 3:39:41  

> Ребят, это всё хорошо, но в реальности проще купить проц что из коробки работает быстрее чем костыли и затычки пихать. Просто потому что 1) время программиста дороже выйде 2) не бульдозером единым 3) кто сказал что под интел нет оптимизаций?

а когда разница в стоимости процессоров в 60 тысяч? :) А их еще ж два нужно.

** ()
[#] Ответ на: комментарий от xpahos 17.01.2012 4:54:22  
true_admin

> а когда разница в стоимости процессоров в 60 тысяч? :) А их еще ж два нужно.

Разница в программистах будет всё равно выше. Требуется и квалификация сильно выше, и времени больше на написание оптимизированного кода, и вероятность всандалить багов больше и разобраться потом сложнее.

Пожалуй, многокомповые конфигурации это единственный случай когда разница даже в 20% производительности серьёзно решает. Тут уже экономия 60тыщ на каждом из сотни серверов будет значительной. Но 99% проектов этого не требуют и расчитаны на запуск на одном компе.

***** ()
[#] Ответ на: комментарий от Napilnik 17.01.2012 3:02:08  
RussianNeuroMancer

> Предлагаешь оптимизировать компиляторы не имея необходимого железа для проверки?
Надо, чтобы нужные патчи были в ядре и gcc за год до релиза процессора, или хотя бы за полгода, но не после.

*** ()
[#] Ответ на: комментарий от RussianNeuroMancer 17.01.2012 6:50:05  
nu11
>>-----Цитата---->>

Надо, чтобы нужные патчи были в ядре и gcc за год до релиза процессора, или хотя бы за полгода, но не после.

<<-----Цитата----<<

разве сотрудники АМД коммитят в ядро и gcc?

***** ()
[#] Ответ на: комментарий от anonymous 17.01.2012 4:23:38  
nu11
>>-----Цитата---->>

бинарные дистрибутивы со своими пакетами под сферические архитектуры в вакууме будут сливать. Владельцам бульдозера придётся ставить генту, хы.

<<-----Цитата----<<

зачем нужна гента для оптимизации пары-тройки нужных софтин? В отличие от красноглазых, нормальные люди вполне могут прожить без собранного с оптимизациями тектового редактора.

***** ()
[#]  

Я правильно понял, что булльдозеры- 32-битные? если да-то зачем они нужны?

* ()
[#] Ответ на: комментарий от nu11 17.01.2012 7:09:32  

Я хз, ЧЯДНТ, но у меня WoW под Wine взлетает только если Вайн собран из исходников с оптимизацией...

* ()
[#] Ответ на: комментарий от anonymous_incognito 17.01.2012 2:13:46  

Процессоры - уже давно не узкое место в производительности домашнего ПК.

**** ()
[#] Ответ на: видел тред на первой странице от druganddrop-2 17.01.2012 2:18:06  

druganddrop-2> В тоже время у intel всё просто работает и не надо изобретать велосипеды при программирование под особенные процессоры.

4.2
См. Itanium

**** ()
[#] Ответ на: комментарий от true_admin 17.01.2012 3:39:41  

true_admin> Ребят, это всё хорошо, но в реальности проще купить проц что из коробки работает быстрее

В реальности проще к процессору хорошую видяху докупить.

**** ()
[#] Ответ на: комментарий от true_admin 17.01.2012 3:39:41  

true_admin> Короче, статья вроде неплохая, но мир она не изменит т.к. 1) кто НАСТОЛЬКО заморачивается скоростью это всё давно знает 2) вряд ли все ломануться переписывать существующий код.

Статья мир целиком не изменит, да. Но тот же Open64 вполне может стать лучше. К тому же существующий код зачастую переписывают постоянно, так как это необходимость.

**** ()
[#] Ответ на: комментарий от xpahos 17.01.2012 4:54:22  

Зависит от области применения. В серверной интернет-части лучше таки поставить ещё компьютер и огрести проблем с энергопотреблением, так как те же сайтики быстро меняются, а нанимать программиста вместо индуса - ещё дороже.

**** ()
[#] Ответ на: комментарий от Vekt 17.01.2012 7:27:42  
redgremlin
>>-----Цитата---->>

Я правильно понял, что булльдозеры- 32-битные?

<<-----Цитата----<<

Упоролся шоле?

***** ()
[#] Ответ на: комментарий от nu11 17.01.2012 7:07:51  

Насчёт ядра не знаю, но в GCC коммитят.

**** ()
[#] Ответ на: комментарий от Vekt 17.01.2012 7:27:42  

Они x86_64. 32-разрядный режим есть, но это уже необходимость сейчас.

**** ()
[#]  
redgremlin

Ахтунг, индусы атакуют - они предлагают unroll small loops, то бишь
a[1]=1;
a[2]=2;
a[3]=3;

***** ()
[#]  
Reset

Почитал source level optimization. AMD тут выступила в роли капитана очевидности. При чем тут бульдозер так и не понял.

***** ()
[#] Ответ на: комментарий от redgremlin 17.01.2012 8:45:23  
Reset

Да и что? Не все компиляторы умеют автоматом разворачивать такой код.

***** ()
[#]  
stalkerg

Купил 8120 разогнал до 3600Mhz (это больше чем у 8150) - радуюсь. :)
Всё отлично работает и по многим тестам оно и intel рвёт просто не везде и не всегда. Ещё надо заметить что на компе обычно много программ вертится и по этому ваши приложения не изолированы как это обычно бывает в тестах.

AMD в отличии от Intel более надёжны (особенно в материнской плате) и т.д.

**** ()
[#] Ответ на: комментарий от stalkerg 17.01.2012 10:28:30  
x905
>>-----Цитата---->>

AMD в отличии от Intel более надёжны (особенно в материнской плате)

<<-----Цитата----<<

как это "более надежны" ? при разгоне штоле ? или молотком по ним если бить ?

** ()
[#] Ответ на: комментарий от stalkerg 17.01.2012 10:28:30  
Reset

> AMD в отличии от Intel более надёжны (особенно в материнской плате) и т.д.

бугога

***** ()
[#]  
wxw

Кстати что там с Trusted Computing на AMD машинах, глубоко засунули, крепко сидит?

*** ()
[#] Ответ на: комментарий от x905 17.01.2012 10:50:01  
CFA

За счет ножек, надежней крепится.

* ()
[#] Ответ на: комментарий от true_admin 17.01.2012 3:39:41  

вот ты тру_админ
а для домашних компов AMD гораздо выгоднее чем Intel.

все равно придется переписывать, рано или поздно :)
думаю PostBulldozer будет получше после некоторого времени..

* ()
[#]  

Бульдозер не тормозит. Тормозят ваши кривые неоптимизированные программы... ага.
// Погодите-ка, где-то мы это уже слышали?

()
[#] Ответ на: комментарий от CFA 17.01.2012 11:27:47  
DarkFlame

Да хотя б более человеческое крепление процессора и кулера к нему! :)

Не, ну у Intel, конечно, были свои причины сделать так, как они сделали. Но этот дикий зоопарк сокетов, неудобные крепления и не очень либеральные цены заставляют для дома выбирать именно AMD.

Тем более, мне встроенного видео вполне хватает (и наплатного, и напроцессного)

* ()
[#] Ответ на: комментарий от CFA 17.01.2012 11:27:47  
x905
>>-----Цитата---->>

За счет ножек, надежней крепится.

<<-----Цитата----<<

а были случаи, что intel-проц выпрыгивал из сокета и бегал по столу ? )

** ()
[#] Ответ на: комментарий от x905 17.01.2012 11:53:46  
DarkFlame

Как он может бегать!

Он же без ножек ))

* ()
[#] Ответ на: комментарий от nu11 17.01.2012 7:09:32  

Называть гентушников красноглазыми могут лишь те кто называет "ботанами" тех кто упешно сдал экзамен по математике в десятом классе. Ничего такое феноменального в генту нет, просто имбицилов вокруг слишком много которым и 2 + 2 слишком сложно. Рождается ыыыыы мем ыыыыы, смишно.

**# ()
[#] Ответ на: комментарий от x905 17.01.2012 11:53:46  

Были случаи что ножки в сокете плавились из-за плохого контакта

anonymous ()
[#] Ответ на: комментарий от stalkerg 17.01.2012 10:28:30  
>>-----Цитата---->>

Купил 8120 разогнал до 3600Mhz (это больше чем у 8150) - радуюсь. :)

<<-----Цитата----<<

Покупаешь 2500К, разгоняешь.. AMD посасывает :3

anonymous ()
[#] Ответ на: комментарий от anonymous 17.01.2012 12:05:18  

Про то, как хорошо с перегрева процессоры от AMD горели, напомнить?

anonymous ()
[#] Ответ на: комментарий от alx_me 17.01.2012 11:58:40  
>>-----Цитата---->>

Называть гентушников красноглазыми могут лишь те кто называет "ботанами" тех кто упешно сдал экзамен по математике в десятом классе

<<-----Цитата----<<

Я никого не называл "ботаном" и что, я теперь не могу назвать гентушнка красноглазым?

()