LINUX.ORG.RU

Помогите собрать данные по процессорам


2

3

Помогите разобраться, как ведут себя однопоточные приложения на современных процессорах. Для этой цели составил тест на основе bzip2. Прошу Вас прогнать его у себя и написать результат.

#!/bin/bash
# Тест gzip с максимальным сжатием под фоновой нагрузкой $1 потоков
echo "Без нагрузки"
time dd if=/dev/zero bs=1M count=4000 | bzip2 -c9 > /dev/null

i1='0'
while [ $i1 -lt $1 ]; do
	nice -n 20 yes > /dev/null &
	let i1++
done

echo "Под нагрузкой $1 потоков"
time dd if=/dev/zero bs=1M count=4000 | bzip2 -c9 > /dev/null

killall yes

В качестве параметра необходимо указать количество потоков фоновой нагрузки. Дайте фоновую нагрузку 1-2 потока на каждое виртуальное ядро.

Напишите результат, модель процессора, количество реальных и виртуальных ядер и ядро системы (harded ядро сильно искажает результаты).

P.S. Если будете проводить тест, не забудьте остановить все другие процессы, нагружающие процессор.

★★★★★

почитай любую книжку по процессорам или лекции на курсере послушай.

разные приложения ведут себя по-разному, у них разная частота появления инструкций. А ты жмёшь нули, какой в этом смысл? что ты меряешь?

dimon555 ★★★★★
()
Ответ на: комментарий от dimon555

Я измеряю просадку производительности одного вычислительного потока при многопоточной нагрузке. У процессоров с гипертрейдингом это болезнь, хотя этот тест на intel atom D525 неожиданно показал падение в 1,33 раза вместо 2. А у процессоров от AMD нет гипертрейдинга, но их ядра собраны попарно с какими то общими ресурсами, и поэтому у них тоже может падать производительность.

Чтобы ответить на этот вопрос теоретически, книжками и лекциями надо обчитаться до уровня инженера по микропроцессорам, а я скромный строитель-конструктор.

kirill_rrr ★★★★★
() автор топика
Ответ на: комментарий от dk-

А вот такого я в данный момент не могу сделать.

kirill_rrr ★★★★★
() автор топика

kirill

Можно грабить корованы!

anonymous
()
Ответ на: комментарий от kirill_rrr

Я измеряю просадку производительности одного вычислительного потока при многопоточной нагрузке. У процессоров с гипертрейдингом это болезнь

это не болезнь, это так задумано. У тредов одни и те же функциональные устройства и разные регистровые файлы. Когда алгоритм программы вызывает мало блокировок на конвейре вычислительном, то никакого выигрыша от гипертредов не будет.

хотя этот тест на intel atom D525 неожиданно показал падение в 1,33 раза вместо 2.

значит кэш у него маленький и треды часто ожидают данные или команды

А у процессоров от AMD нет гипертрейдинга, но их ядра собраны попарно с какими то общими ресурсами,

это они корами обозвали то, что у интела треды. решили немножко мешуры маркетинговой навесить.

dimon555 ★★★★★
()

Дайте фоновую нагрузку 1-2 потока на каждое виртуальное ядро.

6 ядер *2 потока?

aure@xenian64:/tmp$ ./11 12
Без нагрузки
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 49,7385 c, 84,3 MB/c

real    0m49.850s
user    0m46.160s
sys     0m6.353s
Под нагрузкой 12 потоков
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 71,7506 c, 58,5 MB/c

real    1m11.891s
user    0m57.699s
sys     0m13.265s
./11: line 15: 21373 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21374 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21375 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21376 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21377 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21378 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21379 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21380 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21381 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21382 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21383 Завершено      nice -n 20 yes > /dev/null
./11: line 15: 21384 Завершено      nice -n 20 yes > /dev/null

darkenshvein ★★★★★
()

amd fx8350, на 16 потоках без нагрузки 45 секунд, под нагрузкой 55.
запустил потом на 8 для полноты теста, но проц перегрелся и комп потух, так что пишу пока по памяти с телефона. надо менять это чертово стоковое охлаждение. :) приложения не тушил, система - десктоп, запущены два браузера, нетбинс, стим, пиджин, скайпик и плеер.

NeverLoved ★★★★★
()

AMD Athlon(tm) II X4 640 Processor 4ядра, разогнан с 3.0 до 3.6

Без нагрузки
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 57,7118 c, 72,7 MB/c
0.00user 4.16system 0:57.71elapsed 7%CPU (0avgtext+0avgdata 2016maxresident)k
0inputs+0outputs (0major+560minor)pagefaults 0swaps

=======================================================

Под нагрузкой 3 потоков
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 62,596 c, 67,0 MB/c
0.03user 2.19system 1:02.59elapsed 3%CPU (0avgtext+0avgdata 2012maxresident)k
0inputs+0outputs (0major+558minor)pagefaults 0swaps

======================================================

Под нагрузкой 7 потоков
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 57,3235 c, 73,2 MB/c
0.02user 2.18system 0:57.32elapsed 3%CPU (0avgtext+0avgdata 2016maxresident)k
0inputs+0outputs (0major+559minor)pagefaults 0swaps


=====================================================

uname -a
Linux debian 3.12.0-3.12 #3 SMP Fri Nov 15 23:53:50 EET 2013 x86_64 GNU/Linux
nekosargot ★★★
()
Ответ на: комментарий от NeverLoved

amd fx8350, на 16 потоках без нагрузки 45 секунд, под нагрузкой 55. запустил потом на 8 для полноты теста, но проц перегрелся и комп потух, так что пишу пока по памяти с телефона. надо менять это чертово стоковое охлаждение. :) приложения не тушил, система - десктоп, запущены два браузера, нетбинс, стим, пиджин, скайпик и плеер.

У меня у самого до 66 проц разогрелся. Аж немного заочковал - многовато, это не кипятильник от интела. До критической 5 градусов осталось(71). Всё-таки охлаждение deep cool gamma 200 недалеко от стока ушло :( Самое страшное - напряжение на проце я не повышал.

nekosargot ★★★
()
Последнее исправление: nekosargot (всего исправлений: 1)
Ответ на: комментарий от dimon555

Собственно всё это задумано, чтобы найти мобильный процессор (в ноутбуках) с максимально независимыми ядрами. У интела так не задумано, а по линейке АМД А пока нет данных.

У AMD Athlon(tm) II X4 ядра независимые, но в современные ноуты его точно не ставят.

kirill_rrr ★★★★★
() автор топика
Ответ на: комментарий от dimon555

это они корами обозвали то, что у интела треды

У них раздельные целочисленные ядра в отличии от.

devl547 ★★★★★
()
Ответ на: комментарий от kirill_rrr

чтобы найти мобильный процессор (в ноутбуках) с максимально независимыми ядрами.

amd kabini и иди в задницу.

devl547 ★★★★★
()

fx-8350 на частоте 4.1 гига
$uname -r
3.2.0-0.bpo.4-amd64



Без нагрузки
4000+0 записей считано
4000+0 записей написано
скопировано 4194304000 байт (4,2 GB), 55,698 c, 75,3 MB/c

real 0m55.829s
user 0m53.331s
sys 0m7.696s
Под нагрузкой 8 потоков
4000+0 записей считано
4000+0 записей написано
скопировано 4194304000 байт (4,2 GB), 70,6902 c, 59,3 MB/c

real 1m10.855s
user 1m7.020s
sys 0m3.652s



температура не более 50 градусов и 21 в покое
ах да, залман перфома рулит таки стервец ))

bedcasus
()
Ответ на: комментарий от devl547

А задачи все, кроме научных и инженерных рассчётов и серверных приложений. Причём все эти задачи параллельно

kirill_rrr ★★★★★
() автор топика
Ответ на: комментарий от devl547

На атоме если используется 3+ потока то плавно начинается жопа. И уже никакими ухищрениями не получить для чего нибудь полного ядра.

Я разумеется не говорю про задачи, не грузящие процессор. С ними проблем нет на любом процессоре.

kirill_rrr ★★★★★
() автор топика
Последнее исправление: kirill_rrr (всего исправлений: 1)
Ответ на: комментарий от kirill_rrr

На атоме если используется 3+ потока то плавно начинается жопа.

Учитывая, что там in-order - да)
Дело не в ht

devl547 ★★★★★
()
Ответ на: комментарий от anonymous

я вот тоже не знаю, зачем он fx к мангалу прифигачил.

devl547 ★★★★★
()
Ответ на: комментарий от bedcasus

это был Debian 6 i386 c 64-x ведром

Тю, все sse и пр. отключены. Оно даже проц не может нагрузить и прогреть.

anonymous
()
$ ./test.sh 9
Без нагрузки
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 37,4591 c, 112 MB/c

real    0m37.555s
user    0m37.330s
sys     0m1.341s
Под нагрузкой 9 потоков
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 54,2482 c, 77,3 MB/c

real    0m54.413s
user    0m53.944s
sys     0m1.543s



model name      : Intel(R) Core(TM) i7-2600K CPU @ 3.40GHz

$ uname -a
CYGWIN_NT-6.1 localhost-31 1.7.27(0.271/5/3) 2013-12-09 11:54 x86_64 Cygwin
anon8
()
Ответ на: комментарий от anonymous

та лан свистеть )
cat /proc/cpuinfo

...

flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm constant_tsc rep_good nopl nonstop_tsc extd_apicid aperfmperf pni pclmulqdq monitor ssse3 fma cx16 sse4_1 sse4_2 popcnt aes xsave avx f16c lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs xop skinit wdt lwp fma4 nodeid_msr tbm topoext perfctr_core arat cpb hw_pstate npt lbrv svm_lock nrip_save tsc_scale vmcb_clean flushbyasid decodeassists pausefilter pfthreshold
...

bedcasus
()
Ответ на: комментарий от bedcasus

Это cpuid проца, а я про то, как собраны бинарники. Ох уж эти дебианщики. Ты хоть понимаешь, как работают расширенные инструкции?

anonymous
()
./test.sh 2
Без нагрузки
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 67,2986 c, 62,3 MB/c

real    1m7.453s
user    1m3.316s
sys     0m10.273s
Под нагрузкой 2 потоков
4000+0 записей считано
4000+0 записей написано
 скопировано 4194304000 байт (4,2 GB), 64,875 c, 64,7 MB/c

real    1m5.034s
user    1m0.468s
sys     0m9.597s
./test.sh: line 15:  4842 Завершено      nice -n 20 yes > /dev/null
./test.sh: line 15:  4843 Завершено      nice -n 20 yes > /dev/null

система

3.2.0-4-amd64
model name      : AMD Phenom(tm) II X4 945 Processor
WRG ★★★★
()
Ответ на: комментарий от bedcasus

комп лупит тупо бинарники от boinc 24/7

Понятно, на компе делом не занимаешься. Но тебя же должны беспокоить попугаи или производительность-на-ватт?

anonymous
()
Ответ на: комментарий от bedcasus

о, явно гентушник

Ты думаешь, что в твоём дебиане бинари не скомпилены, а дарованы зевсом?

anonymous
()
Ответ на: комментарий от anonymous

Понятно, на компе делом не занимаешься.

хе-хе
ну это ведь приносит деньги ... так что ))

Но тебя же должны беспокоить попугаи или производительность-на-ватт?

да, но трах с неизвестным мне дороже обойдется, уже проверено )

bedcasus
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.