Оптимизация программ

cache

0

2

Подскажите вот те кто оптимизацией программ занимается, вы параметры кэша процессора учитываете при оптимизации?

Ссылка

← scratchbox2 и arch linux

Почему нельзя не думать об архитектуре. →

← 1 2 →

Ответ на: комментарий от robus 30.04.16 10:48:16 MSK

Как минимум выравнивать структуры по границе cache line, если структура нужна вся и сразу.

При векторизации все еще веселее, данные иногда приходится перемешивать, чтобы в одну линию влезли операции чтения для одного SIMD потока. Часто перемешивание, обработка и декодирование в сумме все равно быстрее, чем обработка нелокальных данных.

anonymous
(30.04.16 23:23:46 MSK)

Ответ на: комментарий от registrant27492 30.04.16 15:08:02 MSK

Но зачем собирать под 386-й если можно собрать из сорцов вариант с необходимыми тебе оптимизациями под текущую железку? Хотя, подход, конечно, не везде приемлемый.

alex4321 ★
(30.04.16 23:32:13 MSK)

Ответ на: комментарий от anonymous 30.04.16 23:23:46 MSK

А что ты думаешь насчет того, что процессор будет инвалидировать кеш, когда он не должен этого делать?

anonymous
(30.04.16 23:38:35 MSK)

Ссылка

Ответ на: комментарий от anonymous 30.04.16 23:23:46 MSK

Чё это за набор неведомой херни? Нахрена выравнивать структуры по какой-то границе, нахрена всё остальное?

~~registrant27492~~
(01.05.16 00:31:55 MSK)

Ссылка

Ответ на: комментарий от alex4321 30.04.16 23:32:13 MSK

У пацанов бинарные дистры и всё бинарное - какое там им «собрать под текущую железку»? Поэтому у пацанов принято собирать под 386-й и не париться.

~~registrant27492~~
(01.05.16 00:33:39 MSK)

Ответ на: комментарий от anonymous 30.04.16 23:21:02 MSK

Естественно важнейший, если ты о ней нихрена не знаешь. Кроме 2 заклинаний «кешлайн» и «кешмис» - это все ассоциации, что рандомный адепт знает на слово «оптимизация». В реальном мире кешлайнами ты можешь только подтереться.

~~registrant27492~~
(01.05.16 00:35:15 MSK)

Ссылка

Ответ на: комментарий от Enthusiast 30.04.16 22:45:48 MSK

Работа с памятью внутри и снаружи процессора показана примерами на Си без привязки к компилятору.

Почитал(сколько же боли было в поиске этой вамулатуры на варезниках) - ничего интересно. Пол книги рассуждения о протухших конпелятор, а пол какой-то невнятной пасты из интеловских тулз.

Примеры на си - днище - хотя 2003год - оно и понятно. Смысла всё это принесёт в районе нуля. Лучше уж на мануал по оптимизации от вендора линковать.

~~registrant27492~~
(01.05.16 00:38:08 MSK)

Ссылка

Ответ на: комментарий от registrant27492 01.05.16 00:33:39 MSK

Ну да, то есть заморочиться написанием кода, который определяет, на чём запущен и выбрать соответсвующее ветвление (из числа предусмотренных на момент написания) - более целесообразно. Я конечно и сам скорее за бинарные дистры, но тут, кажется, ты преувеличиваешь. Ок, удачи им.

alex4321 ★
(01.05.16 00:58:05 MSK)

Ответ на: комментарий от alex4321 01.05.16 00:58:05 MSK

ты преувеличиваешь.

Все пацаны орут, что нужны бинари - все. Хотя на них конечно можно покласть.

Тут ещё проблема в нормальном конпеляторе - у пацана стоит гцц3 - что ты с ним сделаешь? Тогда надо таскать за самой целую систему, чтобы на хосте собиралось.

Поэтому много бинарей выгодны ещё и этим.

~~registrant27492~~
(01.05.16 01:06:23 MSK)

Ответ на: комментарий от registrant27492 01.05.16 01:06:23 MSK

Нужны, безусловно. Если условия не заставляют нас заниматься уже даже не простым байтоебством, но с оглядкой на конкретное железо.

«Тогда надо таскать за самой целую систему, чтобы на хосте собиралось.» Пусть кросскомпиляет. Думаю, для задач где это даст критичный прирост производительности - это меньшая из проблем (или таки нет? Тут бы конкретные примеры).

Впрочем, хрен с ним всем.

alex4321 ★
(01.05.16 01:31:16 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

← scratchbox2 и arch linux

Development

Почему нельзя не думать об архитектуре. →

Похожие темы