Про оптимизацию кода

0

1

Усем привет, опция для gcc -O0 отключает все оптимизации? Ну тоесть совсем? А то просто я решил проверить время выполнения функции, и одна итерация занимает 1 мкр а скажем 50к итераций 1к мкр, входны данные использую одни и теже каждый раз, время считаю clock_gettime( CLOCK_REALTIME, &start) или например если я хочу проверить сколько времени займёт вызов pthread_mutex_lock(&mutex); pthread_mutex_unlock(&mutex); то для 1 вызова будет 1мкр, а для техже 50к 1.6к мкр

Ссылка

← помогите настроить Eclips

Портирование приложения на мобильные платформы →

google://rtc resolution

~~hateyoufeel~~ ★★★★★
(15.10.14 00:51:43 MSK)

Ответ на: комментарий от hateyoufeel 15.10.14 00:51:43 MSK

Да, кстати, учитывая суперскалярность, многоуровневую кэш-память и прочие подобные штуки, измерять производительность такий способом - гиблое дело.

~~hateyoufeel~~ ★★★★★
(15.10.14 00:53:08 MSK)

Ответ на: комментарий от hateyoufeel 15.10.14 00:53:08 MSK

То есть время выполнения функции будет зависеть от того в какой я ее прогк вызываю?

Onito
(15.10.14 01:05:47 MSK) автор топика

Ответ на: комментарий от Onito 15.10.14 01:05:47 MSK

Время исполнения кода напрямую зависит от того, есть ли нужные данные в кэше. Например, банальное a+b выполнится за пару циклов, если оба операнда есть в L1-кэше, в противном случае же эта операция застрянет циклов на 200 (кажется такая задержка у DDR3 сейчас).

http://www.akkadia.org/drepper/cpumemory.pdf

Тебе стоит почитать вот это.

~~hateyoufeel~~ ★★★★★
(15.10.14 01:10:23 MSK)

Ответ на: комментарий от hateyoufeel 15.10.14 00:51:43 MSK

Real time плохо считать так как он не учитывает прерывания, а время затраченное на конкретный поток покажет, на х86 асма с rdtsk, короче самое лучшее считать такты на конкретный процесс

Onito
(15.10.14 01:11:44 MSK) автор топика

Ответ на: комментарий от Onito 15.10.14 01:11:44 MSK

Счётчик процессов так же не учитывает прерывания и переключение контекста, так что забудь о нём.

~~hateyoufeel~~ ★★★★★
(15.10.14 01:17:59 MSK)

Ответ на: комментарий от hateyoufeel 15.10.14 01:17:59 MSK

s/процессов/тактов/ разумеется

~~hateyoufeel~~ ★★★★★
(15.10.14 01:18:29 MSK)

Ссылка

Ответ на: комментарий от hateyoufeel 15.10.14 01:10:23 MSK

Да я это все знаю, первый а плюс б или перед ним загрузит данные в кеш выполнив как ты сказал кучу лишних циклов а если сделать стопицот циклов то данные к кеше будут всегда а сложение будет занимать время в наносекундах потому и получается то о чем я говорил. Блин лучшеб тему не создавал) думал мне скажут что я делаю не так а тут оказывается все зависит от в целом от случая и надо в «боевых» условиях проверять все

Onito
(15.10.14 01:22:58 MSK) автор топика

Ссылка

Ответ на: комментарий от hateyoufeel 15.10.14 01:17:59 MSK

Ну хз, я проверял так, создавал два потока и один усыплял и в нем время считал, а во втором что либо делал, в итоге спящий поток всегда показывал единое число тактов, абсолютно одно итоге число, причем если было бы как ты то каждый раз было бы по разному в зависимости от состояние процессов во всей системе

Onito
(15.10.14 01:25:02 MSK) автор топика

Ссылка

Ответ на: комментарий от hateyoufeel 15.10.14 01:17:59 MSK

Ну зачем же так категорично, всякие не дёргающие ядро алгоритмы можно и через rdtsc мерять, главное приоритет повыше процессу поставить (в идеале realtime, конечно), ну и много прогонов делать.

mix_mix ★★★★★
(15.10.14 01:25:21 MSK)
Последнее исправление: mix_mix 15.10.14 01:26:39 MSK (всего исправлений: 1)

Ответ на: комментарий от mix_mix 15.10.14 01:25:21 MSK

Ну зачем же так категорично, всякие не дёргающие syscall алгоритмы можно и через rdtsc мерять

У тебя ОС с вытесняющей многозадачностью :)

~~hateyoufeel~~ ★★★★★
(15.10.14 01:27:30 MSK)

Ответ на: комментарий от mix_mix 15.10.14 01:25:21 MSK

Ну сколько я функций не тестил всегда было примерно так: 3 разных сильно отличающихся числа с небольшим плюс минусом в итоге меньшее число это время работы функции в идеальном случае, среднее это то время на которое стоит ориентироваться и самое большое это то что будет в худшем случае

Onito
(15.10.14 01:29:33 MSK) автор топика

Ссылка

Ответ на: комментарий от hateyoufeel 15.10.14 01:27:30 MSK

Ну поэтому и приоритет realtime должен быть, чтобы многозадачность не мешала, пока сами не позволим :) Тут главное самому в сисколл или page fault не свалиться.

mix_mix ★★★★★
(15.10.14 01:35:08 MSK)

Ссылка

одна итерация занимает 1 мкр а скажем 50к итераций 1к мкр

Короткие временные промежутки замерять нельзя - не хватит разрешающей способности таймеров, слишком велико влияние сторонних факторов типа шедулинга, и оверхеда самой clock_gettime.

slovazap ★★★★★
(15.10.14 06:00:03 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← помогите настроить Eclips

Development

Портирование приложения на мобильные платформы →

Похожие темы