LINUX.ORG.RU
ФорумTalks

немножко аналитики в тему Intel vs AMD

 , , , ,


0

2

Сегодня от нечего делать почитал срач в теме Говорят, штеуд и в следующем году не сможет массово осилить техпроцесс 10нм и хочу внести немного фактов к безосновательным выкрикам сторонников обоих производителей. В частности, о том, что AMD EPYC обгоняет Intel Xeon по производительности.
Логично сравнивать процессоры в реальных задачах. Наиболее ресурсоёмким для процессора является решение задач гидрогазодинамики и механики методом конечных элементов. Самой известной программой для этих целей является ANSYS, который предлагает посмотреть на результаты бенчмарков при решении реальных задач.

Для примера возьмём расчёт выхлопной системы транспортного средства.

Участники

Оцениваются два сервера — один на AMD EPYC 7601 (32 ядра, базовая частота 2.2GHz), второй Cray XC40 с Intel E5-2695v4 (18 ядер, базовая частота 2.1 GHz).

Метод оценки

Баллом считается количество секунд в сутках (86400) делённое на количество секунд, необходимое для расчёта данного бенчммарка, то есть количество бенчмарков, которое можно запустить за сутки на данной системе.
Показателем конкурентоспособности процессора является производительность каждого ядра и его стоимость.
Показателем производительности будем считать количество баллов, которое зарабатывает одно ядро. Стоимость также будем считать простым делением на количество ядер.

Собственно, оценка

Цена ядра у Intel = 212500 / 18 = 11806 руб.

Цена ядра у AMD = 315227 / 32 = 9851 руб.

Производительность на ядро будем считать по ближайшим количествам ядер.
Производительность ядра EPYC колеблется от 2.01 до 2.43 балла на ядро.
Для 72 ядер у Intel производительность 4.93, для 144 — 4.91.

Итог

В самом благоприятном для AMD варианте одно ядро EPYC стоит на ≈20% дешевле. Проигрыш в производительности при этом составляет ≈100%.

Приглашаю основных спорщиков из треда, указанного в первом абзаце: StReLoK, Quasar, steemandlinux, WitcherGeralt, King_Carlo, Serg_HIS.

Перемещено tailgunner из linux-hardware

Deleted

Последнее исправление: frigate_freedom (всего исправлений: 3)

Ответ на: комментарий от tailgunner

Он говорит = 200% (×2), а ты говоришь больше на 100%, итого, вы говорите одно и то же. Изначально он сказал фигню конечно, меньше не на 100, а на 50. Но он просто сам себя запутал и оговорился.

WitcherGeralt ★★
()
Ответ на: комментарий от WitcherGeralt

Проценты - это всегда «больше на» или «меньше на». «Больше в» и «меньше в» - это разы (которые, ИМХО, и надо использовать, потому что их невозможно понять неправильно).

tailgunner ★★★★★
()
Ответ на: комментарий от King_Carlo

Нет. Производительность на ядро очень даже важна. Всё зависит от задач и требований. Повседневные задачи не подразумевают загрузки десятков ядер, тут амд сливает. Интел же начинает сливать на топовых процах, где ядер больше 20, тупо по производительности, даже не по цене за ядро.

WitcherGeralt ★★
()

Вижу вариант с самописным тестом никому не зашёл.

Ну ладно...

Serg_HIS
()
Ответ на: комментарий от Serg_HIS

Я бы тупо погонял линпак для начала. А производительность одного ядра на новых девайсах я казуально замеряю с помощью pystone. Попугаи, конечно, но любопытно.

WitcherGeralt ★★
()
Последнее исправление: WitcherGeralt (всего исправлений: 1)
Ответ на: комментарий от WitcherGeralt

Одно ядро мерять - это не то что мерять многоядерность. Конфликты доступа к памяти и кешу например очень много решают. В зависимости от архитектуры может значительно плавать производительность в зависимости от выбраной стратегии распараллеливания. Можно запилить самим стратегии распараллеливания и выявить на какой архтектуре как лучше..

Serg_HIS
()

Двухкратное преводство как-то сильно сомнительно.

Наиболее ресурсоёмким для процессора является решение задач гидрогазодинамики и механики методом конечных элементов

ТС, обоснуй утверждение.

Не менее реальными, пусть даже менее ресурсоёмкими, задачами являются веб-сервисы, как асинхронные, так и синхронные. Там результаты легко могут выглядеть иначе.

Нельзя сравнивать сферическую производительность в вакууме на основании одной «реальной» задачи. Тем более по попугайским бенчмарками, вычисляющими что попало. Можно ориентироваться только на конкретные результаты в конкретных задачах.

WitcherGeralt ★★
()
Последнее исправление: WitcherGeralt (всего исправлений: 1)
Ответ на: комментарий от WitcherGeralt

Он может разные вариации доступа к памяти имитировать?

Никогда не пользовался если честно.

Я программер и как говорил троллям из прошлого треда мне срачи типа «X vs Y» не интересны.

Serg_HIS
()
Ответ на: комментарий от WitcherGeralt

Ну я предлагаю щёлкать даблы (это большие флоаты) с дёрганьем их из больших массивов данных и записью в массивы, а не просто считать в ядре не выходя за кеш первого уровня, который для каждого ядра свой собственный.

В этом и отличие предложенного мной варианта, что я описал ранее. Он симулирует задачу с доступом к большому объёму данных в памяти и операции над ними.

Serg_HIS
()
Ответ на: комментарий от WitcherGeralt

это они и есть. флоаты это общее название но в некоторых языках это именно 32 битные.

Serg_HIS
()
Ответ на: комментарий от WitcherGeralt

ТС, обоснуй утверждение.

Тут не хватает фразы «в моём случае».

веб-сервисы, как асинхронные, так и синхронные

В этом я совершенно не разбираюсь, а потому не лезу в эту степь.

Нельзя сравнивать сферическую производительность в вакууме на основании одной «реальной» задачи.

Можно открыть другой бенчмарк, сделанный из задачи по обтеканию воздухом шасси Boeing'а, картина примерно такая же.

Тем более по попугайским бенчмарками, вычисляющими что попало.

То, что я привёл в ОП — не классический бенчмарк и там вычисляется не что попало.

Rating is the primary metric used to report performance results of the Fluent Benchmarks. It is defined as the number of benchmarks that can be run on a given machine (in sequence) in a 24 hour period. It is computed by dividing the number of seconds in a day (86400 seconds) by the number of seconds required to run the benchmark. A higher rating means faster performance.

Можно ориентироваться только на конкретные результаты в конкретных задачах.

Это и есть конкретные результаты в конкретной задачи. Читай внимательнее.

Deleted
()
Ответ на: комментарий от darkenshvein

Может быть такое из-за приколов с NUMA

+ они могли поставить 4 плашки памяти вместо восьми, тогда понятно проседание при переходе с 16 потоков на 32...

timdorohin ★★★★
()
Ответ на: комментарий от Deleted

То, что я привёл в ОП

Да тут в треде cinebench или что-то в этом духе проскакивало. Я попугаймарки в противоположность твоему кейсу поставил. Чтобы показать, что ни то, ни другое не имеет смысла.

Это и есть конкретные результаты в конкретной задачи. Читай внимательнее

Проблема в том, что ты на основании конкретного результата в конкретном задании делаешь вывод о производительности в как таковой.

Нельзя сравнивать сферическую производительность в вакууме на основании одной «реальной» задачи

Ещё раз.

WitcherGeralt ★★
()
Ответ на: комментарий от WitcherGeralt

Проблема в том, что ты на основании конкретного результата в конкретном задании делаешь вывод о производительности в как таковой.

немножко аналитики в тему Intel vs AMD (комментарий)

Я не утверждаю, что Xeon абсолютно по всем параметрам лучше EPYC. Для вычислительных задач разумно брать Intel, для cinebench и брутфорса блокчейна — EPYC (по словам King_Carlo).

Читай внимательнее.

Ещё раз.

Deleted
()
Последнее исправление: frigate_freedom (всего исправлений: 1)
Ответ на: комментарий от Deleted

Я читал то, что ты написал в топике. Ты не можешь обвинять меня в невнимательности за то, что я не успеваю следить за твоими переобуваниями.

WitcherGeralt ★★
()
Последнее исправление: WitcherGeralt (всего исправлений: 1)
Ответ на: комментарий от Deleted

Не для cinebench, а для рабочей станции 3D-моделлера который использует Cinema4D. Ну или 3DMax c Corona Renderer

timdorohin ★★★★
()
Ответ на: комментарий от King_Carlo

Даже если считаем выхлоп для жигулей в ANSYS, то полуторакратное преимущество ядра интеля в этой конкретной задаче, запросто может стать экономически менее выгодно, чем решение от амд.

Может. А может и нет. Ты ж не процессоры покупаешь, а готовые серверные блоки. Вот отсюда и надо цену считать. Плюс ещё надёжность, но это вылезет только через несколько лет, тут не угадаешь.

svinorezka
()
Ответ на: комментарий от Iron_Bug

Забей на тред и на сайт.

Я предлагал обсудить написание многопоточного теста для разных архитектур с разными топологиями распараллеливания.

Все слились как рыба об лёд. Им тут лишь бы говносрач развести про что угодно. Писеть - не мешки таскать.

Serg_HIS
()
Ответ на: комментарий от Serg_HIS

Я предлагал обсудить написание многопоточного теста для разных архитектур с разными топологиями распараллеливания.

Напиши, обсудим тогда.

King_Carlo ★★★★★
()
Ответ на: комментарий от WitcherGeralt

Пусть будет так. А как называется то, чем вы тут занимаетесь уже 2 страницы?

Serg_HIS
()
Ответ на: комментарий от Serg_HIS

Если хочешь что-то делать хорошо, делай это сам.

Второй момент. Особого смысла делать тест ради теста нет. Если хотят Интел и АМД доказать что-то, они должны делать это сами, либо созывать некий независимый форум, выкатывать спеки, и пусть независимая команда разработчиков пишет тестирует платформы.

Deleted
()
Ответ на: комментарий от Serg_HIS

Ну почему же? Возможно, что ТС просто не в курсе масштабов проблемы. Компании же не предоставляют спеки в полном объёме. Кроме того, АМД и Интел находятся в разных весовых категориях по политико-экономическим причинам. Это отражается на производительности готовых массовых систем.

Deleted
()

Доцент на балаган батон крошит?

Ребята, а дискуссия уперлась в тупичок. А тупичок в том, что ни у кого нет кучи вёдер на потестить. А вот у Линуса, там, Себастиана - их есть у него. Вот и весь сказ о местном ИТ.

так шта пичалька, да.

Deleted
()
Ответ на: комментарий от Serg_HIS

Профессор, так вы предлагайте железо!
А погроммистка у вас есть! Всё как вы любите!
Взрослая, с опытом, рассудительная, осталось только «мерседес 600» к подъезду подогнать.

Deleted
()
Ответ на: комментарий от Deleted

Если чо - горький сарказм.

Пока что никто из всех на белых конях и тяжелых серверах не сказал главного, так что троллинг и мерянье битодробилками, ага, виртуальными. Ну как у папки дома есть такой компьютер, но я тебе его не покажу, у меня там бабушка в чулане ноги парит.

Deleted
()
Последнее исправление: RTP (всего исправлений: 1)

одно ядро EPYC стоит на ≈20% дешевле.

Железячные треды сегодня доставляют.

ashot ★★★★
()
Ответ на: комментарий от Deleted

Я постараюсь на днях по вечерам запилить настраиваемый тест.

Но на Java.

Уже придумал за вчера 2 варианта выборки из памяти во многопоточности, которые смогут определить с какой из них кеш процов работает лучше.

Думаю позже нарастить еще вариантами. Но там увидим как пойдёт.

Исходники кому нужно, потом дам, чтобы небыло упрёков про подстройку и фальсификацию. Дам и скомпиленные варианты для тех кто просто захочет потестить на своём железе.

Предположительно на следующей неделе смогу дать первый вариант.

Кому не интересно я не заставляю ни думать ни тестить.

Заодно это будет сбор статистики как мне делать стратегию распараллеливания для моих шашек, которые в принципе сейчас продумываю в плане распараллеливания.

Serg_HIS
()
Ответ на: комментарий от Deleted

По-твоему вот это

потребляя больше энергии и выделяя больше тепла

более или так же важно, как и вот это

уделывает существенно более дорогой Xeon

?

templarrr ★★★★★
()
Ответ на: комментарий от Deleted

при этом потребляя больше энергии и выделяя больше тепла.

Масло масляное.

Ещё круче по этому поводу звучит совдеповское «сервисное обслуживание».

Ну реально. Физика. Сколько потребил столько и выделил :)

Serg_HIS
()

Моя задача - самая задачная задача в мире. Ваши задачи - не задачи!

Нормальный сравнительный тест эпиков с зионами есть на андатехе (хотя тоже так себе нормальность, там SQL-тест был с базами, вмещающимися целеком в кеш ЦПУ), гуглите сами. В каких-то задачах там рулят эпики, в каких-то - интелы.

И да, 2017-12 это без патчей на мелтдауноспектр, кстати. Еще вопрос в используемом компиляторе, оптимизациях, всяких AVX, остальных компонентах системы, и, внезапно, жоре электричества. Вполне возможно, что в TCO электричество, особенно в тех странах, где считают эти ваши боинги, занимает далеко не последнее место, и тут еще бабушка надвое сказала - может эти попугаи интелы выдают на AVX-512, а на них в этом режиме по слухам можно вольфрам плавить.

infine
()
Ответ на: комментарий от Serg_HIS

а почему ты решил, что все тут должны отслеживать, что ты там предлагал? вот никакой логики. хочешь писать свой тест - пиши. кстати, никаких проблем с этим нет. задача тривиальная. но совершенно непонятно, зачем это обсуждать на ЛОРе.

пока что писеть горазд только ты. даёшь ссылки на какие-то неработающие ресурсы, а виноваты все вокруг.

Iron_Bug ★★★★★
()
Последнее исправление: Iron_Bug (всего исправлений: 2)
Ответ на: комментарий от iZEN

Щас, погодь...
Окажется что там спектров навезли и meltdown залили.

Хорошо, если по графику пойдут и не будет никаких задержек в десятки недель, а то и месяцев.

Deleted
()
Ответ на: комментарий от Iron_Bug

пока что писеть горазд только ты. даёшь ссылки на какие-то неработающие ресурсы, а виноваты все вокруг.

Бобёр - выдыхай!

На какие ресурсы я даю ссылки здесь и о чём я писец?

Serg_HIS
()
Ответ на: комментарий от Serg_HIS

это ты перестань принимать вещества. ты дал ссылку на какой-то анус, или ансис, который - одна фигня - не работает. и теперь начал обвинять меня(!) в каких-то своих проблемах.

Iron_Bug ★★★★★
()
Ответ на: комментарий от Iron_Bug

Ого...

Я тебя не в чём пока не упрекал, но судя по всему у тебя траблы с веществами...

Я не давал в этом треде никаких ссылок никуда.

Не употребляй сегодня всё. Оставь на следующие выходные хотя бы.

Serg_HIS
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.