LINUX.ORG.RU

Как и чем мерить лошадиные силы CPU?

 ,


0

2
  • У меня есть 2-х ядерный zen 1, как мне узнать его FP32 и вот это вот всё?
  • Как сравнить прирост мощей между поколениями? Говорят, что всякие математические тесты (бенчмарки) могут показать реальную производительность, так ли это?
  • Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации? Например, в кодировании видео, в обсчете LLM, в компиляции кода и т. п.

реальную производительность

Берёшь свои типичные задачи и смотришь их тесты.

как мне узнать его FP32

Это не видеокарта, такой почти параметр бесполезен.

Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации?

Нет.

anonymous
()

гугли «cpu benchmarks», полно сайтов с рейтингами cpu по разным тестам и сравнительными таблицами и диаграммами

просто как пример https://www.cpubenchmark.net/

alysnix ★★★
()

реальную производительность

Берёшь свои типичные задачи и смотришь их тесты.

как мне узнать его FP32

HPL-MxP

Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации?

Да. Требуется высокая квалификация инженера, разрабатывающего модель производительности.

VIT
()

Чего там мерить, и так ясно что лошадь дохлая

DumLemming ★★★
()

Берёшь свои типичные задачи и смотришь их тесты.

гугли «cpu benchmarks»

Passmark’ом и табличками я уже пользуюсь, мне больше интересно, что есть на Linux для измерений вычислительной мощности как в целом, так и по наборам инструкций.

HPL-MxP

О, буду знать.

Чего там мерить, и так ясно что лошадь дохлая

Ну-с, кому что, однако даже дохлые лошади тянут без тормозов современную OS, видосики, браузер, LLM 3-8B, компиляцию wine’а и всё такое прочее))

Reptile
() автор топика
Ответ на: комментарий от Reptile

даже дохлые лошади тянут без тормозов

Показатель «тянут без тормозов» - субъективный. Если вам норм, значит, норм. Рядовой линуксоид, попробовав это, начнёт рвать волосына жone и кричать, что «так жить невозможно!»

tiinn ★★★★★
()

в кодировании видео, в обсчете LLM, в компиляции кода

У фороникса есть test suite. Заходишь в поисковик, вбиваешь название проца и phoronix. Тут возможны нюансы связанные с тем что zen1 тестили на одном ядре и компиляторе, а zen5 уже на другом ядре и другой версии компилятора

cobold ★★★★★
()

Смотри размеры и частоты кэша. Вряд ли сами ядра становятся сильно быстрее с каждым поколением, частоты всё так же ограничены нагревом. Для кодирования видео можно использовать GPU и Video Acceleration API, там не все кодеки доступны, но это быстрее и энергоэффективнее. Для LLM вроде бы нужна видеокарта с максимальной памятью на борту, чтобы туда поместилось больше данных и модель была полезнее.

neumond
()

В BogoMIPS'ах, в чём же ещё. ;))

Dr64h ★★★★
()
Ответ на: комментарий от neumond

Вряд ли сами ядра становятся сильно быстрее с каждым поколением

Мне на ЛОРе как-то люди объяснили, что между Zen2 и Zen3 на определенных задачах прям пропасть (400% в плюс на тех же частотах - не хухры-мухры)

С тех пор у меня в закладках такое: https://www.agner.org/optimize/instruction_tables.pdf

можно прям пальцем посчитать такты на инструкциях для разных ядер.

Toxo2 ★★★★
()

Говорят, что всякие математические тесты (бенчмарки) могут показать реальную производительность, так ли это?

Нет никакой «реальной» производительности. Для разных задач она будет отличаться.

Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации?

В теории — можно. На практике прям полных спецификаций у тебя нет, а ту или иную задачу последовательно по всем инструкциям в скомпиллированном виде ты не анализирова. Так что нет, на практике посчитать не получится. Разве что прикинуть примерно.

Например, в кодировании видео

Запускаешь кодирование, смотришь время. Запускаешь на другом процессоре. Сравниваешь. Вот тебе разница в производительности на конкретной задачи.

Чтобы удобно запускать несколько раз несколько разных тестов и т.д. и т.п., собирать статистику, могу порекомендовать hyperfine.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 2)

Cinebench r23 через wine заодно можно будет сравнить насколько твой проц отстает(или нет) от чьих - то цифер в интернете по тому же процу(насколько твои разгон, охлад, экземпляр хороши)

blokant ★★
()
Ответ на: комментарий от Toxo2

Прирост в 400% в одном тесте, ухудшение на 10% в сотне других тестов, смешанные результаты в тысячах других. В итоге примерно одно и то же с каждым поколением. Есть фундаментальный предел роста для последовательных вычислений, единственная реальная возможность что-то ускорить это сделать жирный кэш или пустить вычисление в параллель (как с теми же векторными инструкциями).

neumond
()
Ответ на: комментарий от neumond

Ядра точно становятся быстрее, благодаря росту Instructions Per Cycle, не от одной частоты всё зависит, хотя и она в среднем понемногу растёт, благодаря улучшению техпроцесса.

anonymous
()
Ответ на: комментарий от neumond

Ухудшений не бывает(не берём в счёт интеловскую лажу с alder lake, и намеренное урезание скорости устаревших инструкций вроде mmx).

Основной рост производительности в процессорах идёт от предсказателя ветвлений и прочей speculative out-of-order лабуды, если не считать кэша и контроллера памяти. Векторные инструкции не везде применимы, это не видеокарта.

anonymous
()
Ответ на: комментарий от neumond

Там горбатый подход с с Infinity Fabric на другом чиплете убивает скорость напрочь. Откуда там взяться вменяемо скалируемым результатам?

anonymous
()

5 раз пересобрать мир с -march=native и столько же раз без него.

fucpsy
()
Последнее исправление: fucpsy (всего исправлений: 2)

Говорят, что всякие математические тесты (бенчмарки) могут показать реальную производительность, так ли это?

Математические тесты показывают производительность математических расчётов (но даже в этом случае лучше сделать бенчмарк из своих расчётов).

Можно ли посчитать примерную производительность камня в той или иной задаче, опираясь только на спецификации?

Если бы был полный код реализации (на верилоге или на чём там их пишут), то наверное как-то можно было бы оценить (нейросеть натренировать:)

annulen ★★★★★
()

Но очень много сейчас зависит от управления питанием внутри проца. Сейчас в процы зашит авторазгон и лимиты по температуре и потребляемой мощности, и при большом числе рабочих потоков и хорошем охлаждении всё упирается именно в мощность. Так что какая по факту получится производительность зависит от количества загруженных ядер и решений, принимаемых автоматикой на ходу по показаниям сенсоров.

annulen ★★★★★
()
Ответ на: комментарий от anonymous

Я имел в виду, что авторазгон процессора (турбобуст) упирается в мощность. А скорость самого расчёта может и в процессор, и в память упираться, но тут я не силён (по крайней мере, я не знаю, как профайлерами получать инфу по боттлнекам в доступе к памяти)

annulen ★★★★★
()
Последнее исправление: annulen (всего исправлений: 1)
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.