LINUX.ORG.RU
ФорумTalks

немножко аналитики в тему Intel vs AMD

 , , , ,


0

2

Сегодня от нечего делать почитал срач в теме Говорят, штеуд и в следующем году не сможет массово осилить техпроцесс 10нм и хочу внести немного фактов к безосновательным выкрикам сторонников обоих производителей. В частности, о том, что AMD EPYC обгоняет Intel Xeon по производительности.
Логично сравнивать процессоры в реальных задачах. Наиболее ресурсоёмким для процессора является решение задач гидрогазодинамики и механики методом конечных элементов. Самой известной программой для этих целей является ANSYS, который предлагает посмотреть на результаты бенчмарков при решении реальных задач.

Для примера возьмём расчёт выхлопной системы транспортного средства.

Участники

Оцениваются два сервера — один на AMD EPYC 7601 (32 ядра, базовая частота 2.2GHz), второй Cray XC40 с Intel E5-2695v4 (18 ядер, базовая частота 2.1 GHz).

Метод оценки

Баллом считается количество секунд в сутках (86400) делённое на количество секунд, необходимое для расчёта данного бенчммарка, то есть количество бенчмарков, которое можно запустить за сутки на данной системе.
Показателем конкурентоспособности процессора является производительность каждого ядра и его стоимость.
Показателем производительности будем считать количество баллов, которое зарабатывает одно ядро. Стоимость также будем считать простым делением на количество ядер.

Собственно, оценка

Цена ядра у Intel = 212500 / 18 = 11806 руб.

Цена ядра у AMD = 315227 / 32 = 9851 руб.

Производительность на ядро будем считать по ближайшим количествам ядер.
Производительность ядра EPYC колеблется от 2.01 до 2.43 балла на ядро.
Для 72 ядер у Intel производительность 4.93, для 144 — 4.91.

Итог

В самом благоприятном для AMD варианте одно ядро EPYC стоит на ≈20% дешевле. Проигрыш в производительности при этом составляет ≈100%.

Приглашаю основных спорщиков из треда, указанного в первом абзаце: StReLoK, Quasar, steemandlinux, WitcherGeralt, King_Carlo, Serg_HIS.

Перемещено tailgunner из linux-hardware

Deleted

Проигрыш в производительности при этом составляет ≈100%.

Получается, производительность нулевая. Вот это поворот.

tailgunner ★★★★★ ()
Ответ на: комментарий от Deleted

никакого отношения эта тема не имеет

Deleted ()
Ответ на: комментарий от Deleted

Скорее, у Xeon'а 200% относительно EPYC.

Скорее, у тебя проплемы с арифметикой.

Производительность ядра EPYC колеблется от 2.01 до 2.43 балла на ядро.

Для 72 ядер у Intel производительность 4.93, для 144 — 4.91.

Если производительность ядра (2.01) EPYC принимаем за 100%, то производительность ядра Intel(4.93) на 145% больше: (4.93 - 2.01)/2.01 == 1.45. Это в лучшем случае, а в худшем - на 102% больше.

tailgunner ★★★★★ ()
Ответ на: комментарий от Deleted

Принес ты, а разбираться как, когда и после каких патчей считалось должен я? Давай уж сам.

entefeed ☆☆☆ ()
Ответ на: комментарий от entefeed

А ты считаешь производительность интеля до кучи патчей по мелтдауну/спектре или после?

На вычислительную производительность эти патчи не влияют.

tailgunner ★★★★★ ()
Ответ на: комментарий от Deleted

в худшем - на 102% больше.

Так я, вроде, то же самое сказал, только округлил до 100.

Разве?

frigate_freedom> Xeon'а 200% относительно EPYC.

А у Xeon-a всего 100% относительно EPYC.

tailgunner ★★★★★ ()
Последнее исправление: tailgunner (всего исправлений: 1)

Наиболее ресурсоёмким для процессора является решение задач гидрогазодинамики и механики методом конечных элементов.

Есть ещё cinebench, например, или брутфорс блокчейна, в этих задачах intel сливает вчистую.

Собственно, оценка

Считать надо по другому. Есть капитальные вложения в оборудование, которые надо отбить в расчетный период на определенных задачах. Даже если считаем выхлоп для жигулей в ANSYS, то полуторакратное преимущество ядра интеля в этой конкретной задаче, запросто может стать экономически менее выгодно, чем решение от амд.

King_Carlo ★★★★★ ()
Ответ на: комментарий от King_Carlo

Есть ещё cinebench, например, или брутфорс блокчейна

Так это сферические задачи в вакууме.

Есть капитальные вложения в оборудование, которые надо отбить в расчетный период на определенных задачах.

Там, где используются такие расчёты (авиакосмическая промышленность, автомобильная промышленность, строительство) покупка сервера с Xeon'ом отобьётся легко.

Deleted ()
Ответ на: комментарий от Deleted

Так это сферические задачи в вакууме.

Вполне себе жизненные задачи, на них можно зарабатывать.

Там, где используются такие расчёты (авиакосмическая промышленность, автомобильная промышленность, строительство) никто денег не считает.

Поправил.

King_Carlo ★★★★★ ()

В частности, о том, что AMD EPYC обгоняет Intel Xeon по производительности.
Логично сравнивать процессоры в реальных задачах.

]

Наиболее ресурсоёмким для процессора является решение задач гидрогазодинамики и механики методом конечных элементов. Самой известной программой для этих целей является ANSYS, ко

чё? причём здесь сервачные процы?

darkenshvein ★★★★★ ()
Последнее исправление: darkenshvein (всего исправлений: 1)
Ответ на: комментарий от darkenshvein

рекомендуемые системные требования

A Server OS (Windows Server or Red Hat Linux/SUSE Enterprise Linux) will be required in the following circumstances:

More than 2 Physical CPU Sockets in a System
Multiple Machines Running in a Cluster
Simultaneous Users on a Machine (Remote or Local)
The latest 64-bit multi-core Intel Xeon and AMD processors with the highest clockspeed and core counts available are recommended. Hyper threading will not improve the speed of simulations, always evaluate the number of physical cores for ANSYS simulation. Always try to get the most recent architecture version of the CPU, even if the clockspeed or number of cores don’t seem to be improved. CPUs today are almost twice as fast as CPUs from 3 years ago listed at the same clockspeed.
Keep in mind that Windows 7/8/10 only support a maximum of two physical CPUs. For more than two physical CPUs, a Windows Server or Linux OS is needed.

https://www.ozeninc.com/ansys-system-hardware-requirements/#tab-id-2

причём здесь сервачные процы?

Где ещё взять процессоры с количеством ядер больше 8? Разве что кластеры делать, но это ещё дороже обойдётся, мне кажется.

Deleted ()
Ответ на: комментарий от darkenshvein

Если пройти по ссылке на бенчмарк, то можно увидеть, что вплоть до 1152 ядер, задействованных при расчёте на Intel все ЦПУ загружены на 100%.

Ядра AMD загружены на 100% при использовании в расчёте только 16 ядер, а потом нагрузка на них снижается. Видимо, есть какое-то bottle-neck.

Deleted ()

Ставлю точку в этом вопросе раз и навсегда. Абсолютно неважно у кого сколько ядер и какая производительность на ядро, есть некий условный паритет в производительности в линейке моделей процессоров у обеих производителей, дальше смотрим начальную стоимость оборудования и считаем совокупную стоимость владения за расчетный период, всё, смотрим в две полученные цифры, делаем выводы.

King_Carlo ★★★★★ ()
Ответ на: комментарий от Deleted

У них там точно все 8 каналов пямяти EPYC'а забиты? А то такое поведение наблюдается у тредриппера 2990WX из-за его четырехканальной памяти.

timdorohin ★★★ ()

Логично сравнивать процессоры в реальных задачах

Логично сравнивать процессоры в разных задачах. Иначе получается сравнение в задачах удобных для сравнивающего.

no-such-file ★★★★★ ()
Ответ на: комментарий от King_Carlo

паритет

Равноценность чего-н., равенство сторон.

Если производительность ядра (2.01) EPYC принимаем за 100%, то производительность ядра Intel(4.93) на 145% больше: (4.93 - 2.01)/2.01 == 1.45. Это в лучшем случае, а в худшем - на 102% больше.

Трудно назвать это паритетом.

смотрим начальную стоимость оборудования

Чтобы получить ту же производительность системы, необходимо в два раза меньше ядер у Intel, так что, покупая Xeon'ы вместо EPYC'ов можно ещё и сэкономить.

Deleted ()
Ответ на: комментарий от timdorohin

Кроме того, что в обеих системах по 128 Gb оперативки на CPU, нет информации.

Deleted ()

Обсуждают выходящие решения, а не текущие. У AMD новый «Тик», а у Intel он сорвался и будет недо-«Так».И это на фоне дефицита производственных мощностей и бушующих уязвимостей.

boowai ★★★★ ()
Ответ на: комментарий от no-such-file

в задачах удобных для сравнивающего.

В задачах, важных для сравнивающего. Я не утверждаю, что Xeon абсолютно по всем параметрам лучше EPYC. Для вычислительных задач разумно брать Intel, для cinebench и брутфорса блокчейна — EPYC (по словам King_Carlo).

Deleted ()
Последнее исправление: frigate_freedom (всего исправлений: 1)
Ответ на: комментарий от Deleted

Равноценность чего-н., равенство сторон.
Трудно назвать это паритетом.

Паритет в производительности, очевидно означает, что, например, 1024 ядра amd равны одному ядру intel, но стоят при этом одинаково, а может быть amd даже дешевле.

так что, покупая Xeon'ы вместо EPYC'ов можно ещё и сэкономить.

пруф

King_Carlo ★★★★★ ()
Ответ на: комментарий от King_Carlo

пруф

6 Xeon'ов (1275000 руб.) выдадут, примерно 1088 баллов в этом бенчмарке. Чтобы получить подобный результат — 1136 балла, нужно 8 EPYC'ов (2521846 руб.). При том, что я брал самую высокую цену на Xeon на рынке.

Deleted ()
Ответ на: комментарий от Deleted

И это только цена на сами процессоры. Меньше процессоров -> меньше расходов на остальные комплектующие.

Deleted ()
Ответ на: комментарий от Deleted

Если пройти по ссылке на бенчмарк, то можно увидеть, что вплоть до 1152 ядер, задействованных при расчёте на Intel все ЦПУ загружены на 100%.

Это ж готовый суперкомпьютер Cray, они умеют адовый интерконнект делать. И в этом их чуде инженерной мысли тоже внутренняя разработка используется. Не удивлюсь, если оно ещё и прямо в кеш процессоров умеет писать. Плюс у них есть специализированные библиотеки, которые позволяют общаться прямо с железкой, в обход ядра операционки. Всё ради выкраивания микросекунд задержек.

Ядра AMD загружены на 100% при использовании в расчёте только 16 ядер, а потом нагрузка на них снижается. Видимо, есть какое-то bottle-neck.

А про AMD написано, что это white box. А это значит, нашли на рынке комплектующие и собрали сами. А значит, взаимодействие либо через поллинг в shared memory, либо через обычный сетевой стек, если между нодами.

(Я видел только Fluent 6.2, он древний уже по сегодняшним меркам. Там была интересная особенность: при работе на одной машине MPI через сеть давал результат лучше, чем MPI через shared memory.)

i-rinat ★★★★★ ()
Ответ на: комментарий от boowai

У AMD новый «Тик», а у Intel он сорвался и будет недо-«Так».И это на фоне дефицита производственных мощностей и бушующих уязвимостей.

Надеюсь, AMD таки догонит Intel. Пора уже пошевелить монополиста.

Deleted ()
Ответ на: комментарий от i-rinat

Это ж готовый суперкомпьютер Cray, они умеют адовый интерконнект делать.

Можно сравнивать двухпроцессорные результаты.

Deleted ()
Ответ на: комментарий от darkenshvein

А зачем мне её сносить? Мне шкворца надо так чтоб удаленные читать да иногда станцевать. Квест пока не прохожу.

StReLoK ☆☆ ()
Ответ на: комментарий от Deleted

Да их там всех поворошить давно надо, не процессоры а болото. Нужна новая гонка архитектур.

StReLoK ☆☆ ()

Понеслось по трубам...

А свежеоткрытый ДОС там пойдётЬ?

Короче, пока что ничего не понятно. А в любой непонятной ситуации - бери Штеуд. :-)

Deleted ()
Ответ на: Понеслось по трубам... от Deleted

Но имеет смысл поискать еще несколько источников сравнения.
Не уверен, что Puget systems обладает такой инфой. Хотя они там раскапывали глюки с Фотошопом или еще каким новомодным софтом, на очень быстрых тачках.

Deleted ()

А как на счёт запилить какие-то простенькие тесты своими руками?

Чай программеры здесь есть.

Если я - то только на Java.

Может придумаем простых интересных задачек для тестов?

Serg_HIS ()

Ну например создать массив на 100000000 даблов, заполнить их рандомными значениями и потом каждое возвести в степень на значение из другого массива тоже рандомно заполненных даблами.

Serg_HIS ()
Ответ на: комментарий от Deleted

Ядра AMD загружены на 100% при использовании в расчёте только 16 ядер, 

А не оптимизировали ли они для 16 ядер, или Интеловский макс 18?

grim ★★★☆ ()
Последнее исправление: grim (всего исправлений: 1)
Ответ на: комментарий от Deleted

Ядра AMD загружены на 100% при использовании в расчёте только 16 ядер, а потом нагрузка на них снижается. Видимо, есть какое-то bottle-neck.

или программа не умеет работать со всеми ядрами на амд.

darkenshvein ★★★★★ ()
Ответ на: комментарий от grim

Возможно, где-то в расчётной модели такое и было выставлено, но вероятность мала. Зачем это делать, если расчёты выполняются на большем, чем 16-18, количестве ядер?

Deleted ()
Ответ на: комментарий от darkenshvein

или программа не умеет работать со всеми ядрами на амд.

Как такое возможно? Оба процессора x86_64.

Deleted ()
Ответ на: комментарий от Deleted

Зачем это делать, 

Свой оптимизированый но кривой планировщик.

grim ★★★☆ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.