LINUX.ORG.RU

Помогите собрать данные по процессорам


2

3

Помогите разобраться, как ведут себя однопоточные приложения на современных процессорах. Для этой цели составил тест на основе bzip2. Прошу Вас прогнать его у себя и написать результат.

#!/bin/bash
# Тест gzip с максимальным сжатием под фоновой нагрузкой $1 потоков
echo "Без нагрузки"
time dd if=/dev/zero bs=1M count=4000 | bzip2 -c9 > /dev/null

i1='0'
while [ $i1 -lt $1 ]; do
	nice -n 20 yes > /dev/null &
	let i1++
done

echo "Под нагрузкой $1 потоков"
time dd if=/dev/zero bs=1M count=4000 | bzip2 -c9 > /dev/null

killall yes

В качестве параметра необходимо указать количество потоков фоновой нагрузки. Дайте фоновую нагрузку 1-2 потока на каждое виртуальное ядро.

Напишите результат, модель процессора, количество реальных и виртуальных ядер и ядро системы (harded ядро сильно искажает результаты).

P.S. Если будете проводить тест, не забудьте остановить все другие процессы, нагружающие процессор.

почитай любую книжку по процессорам или лекции на курсере послушай.

разные приложения ведут себя по-разному, у них разная частота появления инструкций. А ты жмёшь нули, какой в этом смысл? что ты меряешь?

dimon555 ★★★★★ ()
Ответ на: комментарий от dimon555

Я измеряю просадку производительности одного вычислительного потока при многопоточной нагрузке. У процессоров с гипертрейдингом это болезнь, хотя этот тест на intel atom D525 неожиданно показал падение в 1,33 раза вместо 2. А у процессоров от AMD нет гипертрейдинга, но их ядра собраны попарно с какими то общими ресурсами, и поэтому у них тоже может падать производительность.

Чтобы ответить на этот вопрос теоретически, книжками и лекциями надо обчитаться до уровня инженера по микропроцессорам, а я скромный строитель-конструктор.

kirill_rrr ★★★★★ ()

kirill

Можно грабить корованы!

anonymous ()
Ответ на: комментарий от kirill_rrr

Я измеряю просадку производительности одного вычислительного потока при многопоточной нагрузке. У процессоров с гипертрейдингом это болезнь

это не болезнь, это так задумано. У тредов одни и те же функциональные устройства и разные регистровые файлы. Когда алгоритм программы вызывает мало блокировок на конвейре вычислительном, то никакого выигрыша от гипертредов не будет.

хотя этот тест на intel atom D525 неожиданно показал падение в 1,33 раза вместо 2.

значит кэш у него маленький и треды часто ожидают данные или команды

А у процессоров от AMD нет гипертрейдинга, но их ядра собраны попарно с какими то общими ресурсами,

это они корами обозвали то, что у интела треды. решили немножко мешуры маркетинговой навесить.

dimon555 ★★★★★ ()

Дайте фоновую нагрузку 1-2 потока на каждое виртуальное ядро.

6 ядер *2 потока?

aure@xenian64:/tmp$ ./11 12
Без нагрузки
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 49,7385 c, 84,3 MB/c

real    0m49.850s
user    0m46.160s
sys     0m6.353s
Под нагрузкой 12 потоков
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 71,7506 c, 58,5 MB/c

real    1m11.891s
user    0m57.699s
sys     0m13.265s
./11: line 15: 21373 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21374 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21375 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21376 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21377 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21378 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21379 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21380 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21381 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21382 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21383 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21384 Завершено      nice -n 20 yes > /dev/null

darkenshvein ★★★★★ ()

amd fx8350, на 16 потоках без нагрузки 45 секунд, под нагрузкой 55.
запустил потом на 8 для полноты теста, но проц перегрелся и комп потух, так что пишу пока по памяти с телефона. надо менять это чертово стоковое охлаждение. :) приложения не тушил, система - десктоп, запущены два браузера, нетбинс, стим, пиджин, скайпик и плеер.

NeverLoved ★★★★★ ()

AMD Athlon(tm) II X4 640 Processor 4ядра, разогнан с 3.0 до 3.6

Без нагрузки
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 57,7118 c, 72,7 MB/c
0.00user 4.16system 0:57.71elapsed 7%CPU (0avgtext+0avgdata 2016maxresident)k
0inputs+0outputs (0major+560minor)pagefaults 0swaps

=======================================================

Под нагрузкой 3 потоков
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 62,596 c, 67,0 MB/c
0.03user 2.19system 1:02.59elapsed 3%CPU (0avgtext+0avgdata 2012maxresident)k
0inputs+0outputs (0major+558minor)pagefaults 0swaps

======================================================

Под нагрузкой 7 потоков
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 57,3235 c, 73,2 MB/c
0.02user 2.18system 0:57.32elapsed 3%CPU (0avgtext+0avgdata 2016maxresident)k
0inputs+0outputs (0major+559minor)pagefaults 0swaps


=====================================================

uname -a
Linux debian 3.12.0-3.12 #3 SMP Fri Nov 15 23:53:50 EET 2013 x86_64 GNU/Linux
nekosargot ★★★ ()
Ответ на: комментарий от NeverLoved

amd fx8350, на 16 потоках без нагрузки 45 секунд, под нагрузкой 55. запустил потом на 8 для полноты теста, но проц перегрелся и комп потух, так что пишу пока по памяти с телефона. надо менять это чертово стоковое охлаждение. :) приложения не тушил, система - десктоп, запущены два браузера, нетбинс, стим, пиджин, скайпик и плеер.

У меня у самого до 66 проц разогрелся. Аж немного заочковал - многовато, это не кипятильник от интела. До критической 5 градусов осталось(71). Всё-таки охлаждение deep cool gamma 200 недалеко от стока ушло :( Самое страшное - напряжение на проце я не повышал.

nekosargot ★★★ ()
Последнее исправление: nekosargot (всего исправлений: 1)
Ответ на: комментарий от dimon555

Собственно всё это задумано, чтобы найти мобильный процессор (в ноутбуках) с максимально независимыми ядрами. У интела так не задумано, а по линейке АМД А пока нет данных.

У AMD Athlon(tm) II X4 ядра независимые, но в современные ноуты его точно не ставят.

kirill_rrr ★★★★★ ()
Ответ на: комментарий от dimon555

это они корами обозвали то, что у интела треды

У них раздельные целочисленные ядра в отличии от.

devl547 ★★★★★ ()
Ответ на: комментарий от kirill_rrr

чтобы найти мобильный процессор (в ноутбуках) с максимально независимыми ядрами.

amd kabini и иди в задницу.

devl547 ★★★★★ ()

fx-8350 на частоте 4.1 гига
$uname -r
3.2.0-0.bpo.4-amd64



Без нагрузки
4000+0 записей считано
4000+0 записей написано
скопировано 4194304000 байт (4,2 GB), 55,698 c, 75,3 MB/c

real 0m55.829s
user 0m53.331s
sys 0m7.696s
Под нагрузкой 8 потоков
4000+0 записей считано
4000+0 записей написано
скопировано 4194304000 байт (4,2 GB), 70,6902 c, 59,3 MB/c

real 1m10.855s
user 1m7.020s
sys 0m3.652s



температура не более 50 градусов и 21 в покое
ах да, залман перфома рулит таки стервец ))

bedcasus ()
Ответ на: комментарий от devl547

А задачи все, кроме научных и инженерных рассчётов и серверных приложений. Причём все эти задачи параллельно

kirill_rrr ★★★★★ ()
Ответ на: комментарий от devl547

На атоме если используется 3+ потока то плавно начинается жопа. И уже никакими ухищрениями не получить для чего нибудь полного ядра.

Я разумеется не говорю про задачи, не грузящие процессор. С ними проблем нет на любом процессоре.

kirill_rrr ★★★★★ ()
Последнее исправление: kirill_rrr (всего исправлений: 1)
Ответ на: комментарий от kirill_rrr

На атоме если используется 3+ потока то плавно начинается жопа.

Учитывая, что там in-order - да)
Дело не в ht

devl547 ★★★★★ ()
Ответ на: комментарий от anonymous

я вот тоже не знаю, зачем он fx к мангалу прифигачил.

devl547 ★★★★★ ()
Ответ на: комментарий от bedcasus

это был Debian 6 i386 c 64-x ведром

Тю, все sse и пр. отключены. Оно даже проц не может нагрузить и прогреть.

anonymous ()
$ ./test.sh 9
Без нагрузки
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 37,4591 c, 112 MB/c

real    0m37.555s
user    0m37.330s
sys     0m1.341s
Под нагрузкой 9 потоков
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 54,2482 c, 77,3 MB/c

real    0m54.413s
user    0m53.944s
sys     0m1.543s



model name      : Intel(R) Core(TM) i7-2600K CPU @ 3.40GHz

$ uname -a
CYGWIN_NT-6.1 localhost-31 1.7.27(0.271/5/3) 2013-12-09 11:54 x86_64 Cygwin
anon8 ()
Ответ на: комментарий от anonymous

та лан свистеть )
cat /proc/cpuinfo

...

flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm constant_tsc rep_good nopl nonstop_tsc extd_apicid aperfmperf pni pclmulqdq monitor ssse3 fma cx16 sse4_1 sse4_2 popcnt aes xsave avx f16c lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs xop skinit wdt lwp fma4 nodeid_msr tbm topoext perfctr_core arat cpb hw_pstate npt lbrv svm_lock nrip_save tsc_scale vmcb_clean flushbyasid decodeassists pausefilter pfthreshold
...

bedcasus ()
Ответ на: комментарий от bedcasus

Это cpuid проца, а я про то, как собраны бинарники. Ох уж эти дебианщики. Ты хоть понимаешь, как работают расширенные инструкции?

anonymous ()
./test.sh 2
Без нагрузки
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 67,2986 c, 62,3 MB/c

real    1m7.453s
user    1m3.316s
sys     0m10.273s
Под нагрузкой 2 потоков
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 64,875 c, 64,7 MB/c

real    1m5.034s
user    1m0.468s
sys     0m9.597s
./test.sh: line 15:  4842 Завершено      nice -n 20 yes > /dev/null
./test.sh: line 15:  4843 Завершено      nice -n 20 yes > /dev/null

система

3.2.0-4-amd64
model name      : AMD Phenom(tm) II X4 945 Processor
WRG ★★★★ ()
Ответ на: комментарий от bedcasus

комп лупит тупо бинарники от boinc 24/7

Понятно, на компе делом не занимаешься. Но тебя же должны беспокоить попугаи или производительность-на-ватт?

anonymous ()
Ответ на: комментарий от bedcasus

о, явно гентушник

Ты думаешь, что в твоём дебиане бинари не скомпилены, а дарованы зевсом?

anonymous ()
Ответ на: комментарий от anonymous

Понятно, на компе делом не занимаешься.

хе-хе
ну это ведь приносит деньги ... так что ))

Но тебя же должны беспокоить попугаи или производительность-на-ватт?

да, но трах с неизвестным мне дороже обойдется, уже проверено )

bedcasus ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.