немножко аналитики в тему Intel vs AMD

0

2

Сегодня от нечего делать почитал срач в теме Говорят, штеуд и в следующем году не сможет массово осилить техпроцесс 10нм и хочу внести немного фактов к безосновательным выкрикам сторонников обоих производителей. В частности, о том, что AMD EPYC обгоняет Intel Xeon по производительности.
Логично сравнивать процессоры в реальных задачах. Наиболее ресурсоёмким для процессора является решение задач гидрогазодинамики и механики методом конечных элементов. Самой известной программой для этих целей является ANSYS, который предлагает посмотреть на результаты бенчмарков при решении реальных задач.

Для примера возьмём расчёт выхлопной системы транспортного средства.

Участники

Оцениваются два сервера — один на AMD EPYC 7601 (32 ядра, базовая частота 2.2GHz), второй Cray XC40 с Intel E5-2695v4 (18 ядер, базовая частота 2.1 GHz).

Метод оценки

Баллом считается количество секунд в сутках (86400) делённое на количество секунд, необходимое для расчёта данного бенчммарка, то есть количество бенчмарков, которое можно запустить за сутки на данной системе.
Показателем конкурентоспособности процессора является производительность каждого ядра и его стоимость.
Показателем производительности будем считать количество баллов, которое зарабатывает одно ядро. Стоимость также будем считать простым делением на количество ядер.

Собственно, оценка

Цена ядра у Intel = 212500 / 18 = 11806 руб.

Цена ядра у AMD = 315227 / 32 = 9851 руб.

Производительность на ядро будем считать по ближайшим количествам ядер.
Производительность ядра EPYC колеблется от 2.01 до 2.43 балла на ядро.
Для 72 ядер у Intel производительность 4.93, для 144 — 4.91.

Итог

В самом благоприятном для AMD варианте одно ядро EPYC стоит на ≈20% дешевле. Проигрыш в производительности при этом составляет ≈100%.

Приглашаю основных спорщиков из треда, указанного в первом абзаце: ~~StReLoK~~, ~~Quasar~~, steemandlinux, ~~WitcherGeralt~~, ~~King_Carlo~~, ~~Serg_HIS~~.

Перемещено tailgunner из linux-hardware

Ссылка

←	Как стать девопсом

libastral.so таки был собран криво

→

← 1 2 3 →

Ответ на: комментарий от Deleted 29.09.18 16:58:35 MSK

Скорее, однопроцессорные.

i-rinat ★★★★★
(29.09.18 17:58:53 MSK)

Ссылка

Ответ на: комментарий от tailgunner 29.09.18 15:21:01 MSK

Он говорит = 200% (×2), а ты говоришь больше на 100%, итого, вы говорите одно и то же. Изначально он сказал фигню конечно, меньше не на 100, а на 50. Но он просто сам себя запутал и оговорился.

~~WitcherGeralt~~ ★★
(29.09.18 18:40:49 MSK)

Ответ на: комментарий от WitcherGeralt 29.09.18 18:40:49 MSK

Проценты - это всегда «больше на» или «меньше на». «Больше в» и «меньше в» - это разы (которые, ИМХО, и надо использовать, потому что их невозможно понять неправильно).

tailgunner ★★★★★
(29.09.18 18:44:40 MSK)

Ответ на: комментарий от King_Carlo 29.09.18 16:09:26 MSK

Нет. Производительность на ядро очень даже важна. Всё зависит от задач и требований. Повседневные задачи не подразумевают загрузки десятков ядер, тут амд сливает. Интел же начинает сливать на топовых процах, где ядер больше 20, тупо по производительности, даже не по цене за ядро.

~~WitcherGeralt~~ ★★
(29.09.18 18:48:27 MSK)

Ссылка

Ответ на: комментарий от tailgunner 29.09.18 18:44:40 MSK

Можно же сказать «300% от».

~~WitcherGeralt~~ ★★
(29.09.18 18:49:30 MSK)

Вижу вариант с самописным тестом никому не зашёл.

Ну ладно...

~~Serg_HIS~~
(29.09.18 18:50:09 MSK)

Ссылка

Ответ на: комментарий от Serg_HIS 29.09.18 17:14:59 MSK

Я бы тупо погонял линпак для начала. А производительность одного ядра на новых девайсах я казуально замеряю с помощью pystone. Попугаи, конечно, но любопытно.

~~WitcherGeralt~~ ★★
(29.09.18 18:55:37 MSK)
Последнее исправление: WitcherGeralt 29.09.18 18:56:49 MSK (всего исправлений: 1)

Ответ на: комментарий от WitcherGeralt 29.09.18 18:49:30 MSK

Можно же сказать «300% от».

Можно. Но я не слышал, чтобы так говорили.

tailgunner ★★★★★
(29.09.18 18:58:06 MSK)

Ответ на: комментарий от WitcherGeralt 29.09.18 18:55:37 MSK

Одно ядро мерять - это не то что мерять многоядерность. Конфликты доступа к памяти и кешу например очень много решают. В зависимости от архитектуры может значительно плавать производительность в зависимости от выбраной стратегии распараллеливания. Можно запилить самим стратегии распараллеливания и выявить на какой архтектуре как лучше..

~~Serg_HIS~~
(29.09.18 18:59:33 MSK)

Двухкратное преводство как-то сильно сомнительно.

Наиболее ресурсоёмким для процессора является решение задач гидрогазодинамики и механики методом конечных элементов

ТС, обоснуй утверждение.

Не менее реальными, пусть даже менее ресурсоёмкими, задачами являются веб-сервисы, как асинхронные, так и синхронные. Там результаты легко могут выглядеть иначе.

Нельзя сравнивать сферическую производительность в вакууме на основании одной «реальной» задачи. Тем более по попугайским бенчмарками, вычисляющими что попало. Можно ориентироваться только на конкретные результаты в конкретных задачах.

~~WitcherGeralt~~ ★★
(29.09.18 19:07:52 MSK)
Последнее исправление: WitcherGeralt 29.09.18 19:11:28 MSK (всего исправлений: 1)

Ответ на: комментарий от tailgunner 29.09.18 18:58:06 MSK

А я слышал.

~~WitcherGeralt~~ ★★
(29.09.18 19:08:44 MSK)

Ссылка

Ответ на: комментарий от Serg_HIS 29.09.18 18:59:33 MSK

Ну так я и назал линпак, а про одно ядро просто к слову добавил.

~~WitcherGeralt~~ ★★
(29.09.18 19:10:47 MSK)

Ответ на: комментарий от WitcherGeralt 29.09.18 19:10:47 MSK

Он может разные вариации доступа к памяти имитировать?

Никогда не пользовался если честно.

Я программер и как говорил троллям из прошлого треда мне срачи типа «X vs Y» не интересны.

~~Serg_HIS~~
(29.09.18 19:13:44 MSK)

Ответ на: комментарий от Serg_HIS 29.09.18 19:13:44 MSK

Он просто щёлкает флоаты, это стандартный бенчмарк для суперкомпьютеров и в принципе всего-всего.

~~WitcherGeralt~~ ★★
(29.09.18 19:17:56 MSK)

Ответ на: комментарий от WitcherGeralt 29.09.18 19:17:56 MSK

Ну я предлагаю щёлкать даблы (это большие флоаты) с дёрганьем их из больших массивов данных и записью в массивы, а не просто считать в ядре не выходя за кеш первого уровня, который для каждого ядра свой собственный.

В этом и отличие предложенного мной варианта, что я описал ранее. Он симулирует задачу с доступом к большому объёму данных в памяти и операции над ними.

~~Serg_HIS~~
(29.09.18 19:21:37 MSK)

Ответ на: комментарий от Serg_HIS 29.09.18 19:21:37 MSK

И так 64-битные считают.

~~WitcherGeralt~~ ★★
(29.09.18 19:27:43 MSK)
Последнее исправление: WitcherGeralt 29.09.18 19:28:07 MSK (всего исправлений: 1)

Ответ на: комментарий от WitcherGeralt 29.09.18 19:27:43 MSK

это они и есть. флоаты это общее название но в некоторых языках это именно 32 битные.

~~Serg_HIS~~
(29.09.18 19:29:01 MSK)

Ссылка

Ответ на: комментарий от WitcherGeralt 29.09.18 19:27:43 MSK

хотя мат сопроцессор даже в i486 умел 80 битные.

~~Serg_HIS~~
(29.09.18 19:29:49 MSK)

Ссылка

Ответ на: комментарий от WitcherGeralt 29.09.18 19:07:52 MSK

ТС, обоснуй утверждение.

Тут не хватает фразы «в моём случае».

веб-сервисы, как асинхронные, так и синхронные

В этом я совершенно не разбираюсь, а потому не лезу в эту степь.

Нельзя сравнивать сферическую производительность в вакууме на основании одной «реальной» задачи.

Можно открыть другой бенчмарк, сделанный из задачи по обтеканию воздухом шасси Boeing'а, картина примерно такая же.

Тем более по попугайским бенчмарками, вычисляющими что попало.

То, что я привёл в ОП — не классический бенчмарк и там вычисляется не что попало.

Rating is the primary metric used to report performance results of the Fluent Benchmarks. It is defined as the number of benchmarks that can be run on a given machine (in sequence) in a 24 hour period. It is computed by dividing the number of seconds in a day (86400 seconds) by the number of seconds required to run the benchmark. A higher rating means faster performance.

Можно ориентироваться только на конкретные результаты в конкретных задачах.

Это и есть конкретные результаты в конкретной задачи. Читай внимательнее.

Deleted
(29.09.18 19:38:58 MSK)

Ответ на: комментарий от darkenshvein 29.09.18 17:40:14 MSK

Может быть такое из-за приколов с NUMA

+ они могли поставить 4 плашки памяти вместо восьми, тогда понятно проседание при переходе с 16 потоков на 32...

timdorohin ★★★★
(29.09.18 19:47:14 MSK)

Ссылка

Ответ на: комментарий от Deleted 29.09.18 19:38:58 MSK

То, что я привёл в ОП

Да тут в треде cinebench или что-то в этом духе проскакивало. Я попугаймарки в противоположность твоему кейсу поставил. Чтобы показать, что ни то, ни другое не имеет смысла.

Это и есть конкретные результаты в конкретной задачи. Читай внимательнее

Проблема в том, что ты на основании конкретного результата в конкретном задании делаешь вывод о производительности в как таковой.

Нельзя сравнивать сферическую производительность в вакууме на основании одной «реальной» задачи

Ещё раз.

~~WitcherGeralt~~ ★★
(29.09.18 20:02:44 MSK)

Ответ на: комментарий от WitcherGeralt 29.09.18 20:02:44 MSK

Проблема в том, что ты на основании конкретного результата в конкретном задании делаешь вывод о производительности в как таковой.

немножко аналитики в тему Intel vs AMD (комментарий)

Я не утверждаю, что Xeon абсолютно по всем параметрам лучше EPYC. Для вычислительных задач разумно брать Intel, для cinebench и брутфорса блокчейна — EPYC (по словам King_Carlo).

Читай внимательнее.

Ещё раз.

Deleted
(29.09.18 20:25:52 MSK)
Последнее исправление: frigate_freedom 29.09.18 20:27:12 MSK (всего исправлений: 1)

Ответ на: комментарий от Deleted 29.09.18 20:25:52 MSK

Я читал то, что ты написал в топике. Ты не можешь обвинять меня в невнимательности за то, что я не успеваю следить за твоими переобуваниями.

~~WitcherGeralt~~ ★★
(29.09.18 20:38:00 MSK)
Последнее исправление: WitcherGeralt 29.09.18 20:40:33 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Deleted 29.09.18 16:37:03 MSK

Не для cinebench, а для рабочей станции 3D-моделлера который использует Cinema4D. Ну или 3DMax c Corona Renderer

timdorohin ★★★★
(29.09.18 20:46:08 MSK)

Ссылка

Ответ на: комментарий от King_Carlo 29.09.18 15:34:54 MSK

Даже если считаем выхлоп для жигулей в ANSYS, то полуторакратное преимущество ядра интеля в этой конкретной задаче, запросто может стать экономически менее выгодно, чем решение от амд.

Может. А может и нет. Ты ж не процессоры покупаешь, а готовые серверные блоки. Вот отсюда и надо цену считать. Плюс ещё надёжность, но это вылезет только через несколько лет, тут не угадаешь.

~~svinorezka~~
(29.09.18 21:14:07 MSK)

Ссылка

Ответ на: комментарий от Deleted 29.09.18 15:29:13 MSK

а мне выдал 404 и предлагает поговорить об этом («click below to start a conversation with ANSYS»).

Iron_Bug ★★★★★
(29.09.18 22:04:05 MSK)

Ответ на: комментарий от Iron_Bug 29.09.18 22:04:05 MSK

Забей на тред и на сайт.

Я предлагал обсудить написание многопоточного теста для разных архитектур с разными топологиями распараллеливания.

Все слились как рыба об лёд. Им тут лишь бы говносрач развести про что угодно. Писеть - не мешки таскать.

~~Serg_HIS~~
(29.09.18 22:35:57 MSK)

Ответ на: комментарий от Serg_HIS 29.09.18 22:35:57 MSK

Я предлагал обсудить написание многопоточного теста для разных архитектур с разными топологиями распараллеливания.

Напиши, обсудим тогда.

~~King_Carlo~~ ★★★★★
(29.09.18 23:32:07 MSK)

Ссылка

Ответ на: комментарий от Serg_HIS 29.09.18 22:35:57 MSK

Предлагать написание велосипеда — моветон.

~~WitcherGeralt~~ ★★
(30.09.18 10:15:45 MSK)

Ответ на: комментарий от WitcherGeralt 30.09.18 10:15:45 MSK

Пусть будет так. А как называется то, чем вы тут занимаетесь уже 2 страницы?

~~Serg_HIS~~
(30.09.18 10:44:26 MSK)

Ссылка

Ответ на: комментарий от Serg_HIS 29.09.18 22:35:57 MSK

Если хочешь что-то делать хорошо, делай это сам.

Второй момент. Особого смысла делать тест ради теста нет. Если хотят Интел и АМД доказать что-то, они должны делать это сами, либо созывать некий независимый форум, выкатывать спеки, и пусть независимая команда разработчиков пишет тестирует платформы.

Deleted
(30.09.18 11:32:48 MSK)

Ответ на: комментарий от Deleted 30.09.18 11:32:48 MSK

Тоесть тема тупо флуд и троллинг. Тогда удалить её к чертям.

~~Serg_HIS~~
(30.09.18 11:54:01 MSK)

Ответ на: комментарий от Serg_HIS 30.09.18 11:54:01 MSK

Ну почему же? Возможно, что ТС просто не в курсе масштабов проблемы. Компании же не предоставляют спеки в полном объёме. Кроме того, АМД и Интел находятся в разных весовых категориях по политико-экономическим причинам. Это отражается на производительности готовых массовых систем.

Deleted
(30.09.18 12:02:28 MSK)

Ссылка

Доцент на балаган батон крошит?

Ребята, а дискуссия уперлась в тупичок. А тупичок в том, что ни у кого нет кучи вёдер на потестить. А вот у Линуса, там, Себастиана - их есть у него. Вот и весь сказ о местном ИТ.

так шта пичалька, да.

Deleted
(30.09.18 12:19:51 MSK)

Ссылка

Ответ на: комментарий от Serg_HIS 30.09.18 11:54:01 MSK

Профессор, так вы предлагайте железо!
А погроммистка у вас есть! Всё как вы любите!
Взрослая, с опытом, рассудительная, осталось только «мерседес 600» к подъезду подогнать.

Deleted
(30.09.18 12:21:37 MSK)

Ответ на: комментарий от Deleted 30.09.18 12:21:37 MSK

Если чо - горький сарказм.

Пока что никто из всех на белых конях и тяжелых серверах не сказал главного, так что троллинг и мерянье битодробилками, ага, виртуальными. Ну как у папки дома есть такой компьютер, но я тебе его не покажу, у меня там бабушка в чулане ноги парит.

Deleted
(30.09.18 12:23:16 MSK)
Последнее исправление: RTP 30.09.18 12:23:42 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Serg_HIS 29.09.18 22:35:57 MSK

Я не программист, но в тестах могу поучаствовать.

Deleted
(30.09.18 14:48:00 MSK)

одно ядро EPYC стоит на ≈20% дешевле.

Железячные треды сегодня доставляют.

ashot ★★★★
(30.09.18 15:12:09 MSK)

Ссылка

Ответ на: комментарий от Deleted 30.09.18 14:48:00 MSK

Я постараюсь на днях по вечерам запилить настраиваемый тест.

Но на Java.

Уже придумал за вчера 2 варианта выборки из памяти во многопоточности, которые смогут определить с какой из них кеш процов работает лучше.

Думаю позже нарастить еще вариантами. Но там увидим как пойдёт.

Исходники кому нужно, потом дам, чтобы небыло упрёков про подстройку и фальсификацию. Дам и скомпиленные варианты для тех кто просто захочет потестить на своём железе.

Предположительно на следующей неделе смогу дать первый вариант.

Кому не интересно я не заставляю ни думать ни тестить.

Заодно это будет сбор статистики как мне делать стратегию распараллеливания для моих шашек, которые в принципе сейчас продумываю в плане распараллеливания.

~~Serg_HIS~~
(30.09.18 18:07:29 MSK)

Ссылка

https://www.youtube.com/watch?v=YeXtTYAPzXU

А в этом видео можно наблюдать, как Threadripper уделывает существенно более дорогой Xeon, но не сильно, при этом потребляя больше энергии и выделяя больше тепла.

Deleted
(30.09.18 18:34:07 MSK)

Ответ на: комментарий от Deleted 30.09.18 18:34:07 MSK

По-твоему вот это

потребляя больше энергии и выделяя больше тепла

более или так же важно, как и вот это

уделывает существенно более дорогой Xeon

templarrr ★★★★★
(30.09.18 20:23:58 MSK)

Ответ на: комментарий от templarrr 30.09.18 20:23:58 MSK

Нет.

Deleted
(30.09.18 20:25:08 MSK)

Ссылка

Ответ на: комментарий от Deleted 30.09.18 18:34:07 MSK

при этом потребляя больше энергии и выделяя больше тепла.

Масло масляное.

Ещё круче по этому поводу звучит совдеповское «сервисное обслуживание».

Ну реально. Физика. Сколько потребил столько и выделил :)

~~Serg_HIS~~
(30.09.18 21:58:22 MSK)

Ссылка

Моя задача - самая задачная задача в мире. Ваши задачи - не задачи!

Нормальный сравнительный тест эпиков с зионами есть на андатехе (хотя тоже так себе нормальность, там SQL-тест был с базами, вмещающимися целеком в кеш ЦПУ), гуглите сами. В каких-то задачах там рулят эпики, в каких-то - интелы.

И да, 2017-12 это без патчей на мелтдауноспектр, кстати. Еще вопрос в используемом компиляторе, оптимизациях, всяких AVX, остальных компонентах системы, и, внезапно, жоре электричества. Вполне возможно, что в TCO электричество, особенно в тех странах, где считают эти ваши боинги, занимает далеко не последнее место, и тут еще бабушка надвое сказала - может эти попугаи интелы выдают на AVX-512, а на них в этом режиме по слухам можно вольфрам плавить.

infine ★
(30.09.18 22:20:37 MSK)

Ссылка

Ответ на: комментарий от Serg_HIS 29.09.18 22:35:57 MSK

а почему ты решил, что все тут должны отслеживать, что ты там предлагал? вот никакой логики. хочешь писать свой тест - пиши. кстати, никаких проблем с этим нет. задача тривиальная. но совершенно непонятно, зачем это обсуждать на ЛОРе.

пока что писеть горазд только ты. даёшь ссылки на какие-то неработающие ресурсы, а виноваты все вокруг.

Iron_Bug ★★★★★
(30.09.18 22:25:05 MSK)
Последнее исправление: Iron_Bug 30.09.18 22:28:41 MSK (всего исправлений: 2)

Первые образцы AMD Zen 2: 8 ядер, 16 потоков и частота до 4,5 ГГц

iZEN ★★★★★
(30.09.18 23:14:22 MSK)

Ответ на: комментарий от iZEN 30.09.18 23:14:22 MSK

Щас, погодь...
Окажется что там спектров навезли и meltdown залили.

Хорошо, если по графику пойдут и не будет никаких задержек в десятки недель, а то и месяцев.

Deleted
(30.09.18 23:21:51 MSK)

Ссылка

Ответ на: комментарий от Iron_Bug 30.09.18 22:25:05 MSK

пока что писеть горазд только ты. даёшь ссылки на какие-то неработающие ресурсы, а виноваты все вокруг.

Бобёр - выдыхай!

На какие ресурсы я даю ссылки здесь и о чём я писец?

~~Serg_HIS~~
(30.09.18 23:57:08 MSK)

Ответ на: комментарий от Serg_HIS 30.09.18 23:57:08 MSK

это ты перестань принимать вещества. ты дал ссылку на какой-то анус, или ансис, который - одна фигня - не работает. и теперь начал обвинять меня(!) в каких-то своих проблемах.

Iron_Bug ★★★★★
(01.10.18 00:20:57 MSK)

Ответ на: комментарий от Iron_Bug 01.10.18 00:20:57 MSK

Ого...

Я тебя не в чём пока не упрекал, но судя по всему у тебя траблы с веществами...

Я не давал в этом треде никаких ссылок никуда.

Не употребляй сегодня всё. Оставь на следующие выходные хотя бы.

~~Serg_HIS~~
(01.10.18 00:23:15 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 →

←	Как стать девопсом

Talks

libastral.so таки был собран криво

→

Если чо - горький сарказм.

Похожие темы