LINUX.ORG.RU

Ответ на: комментарий от robus

Как минимум выравнивать структуры по границе cache line, если структура нужна вся и сразу.

При векторизации все еще веселее, данные иногда приходится перемешивать, чтобы в одну линию влезли операции чтения для одного SIMD потока. Часто перемешивание, обработка и декодирование в сумме все равно быстрее, чем обработка нелокальных данных.

anonymous
()
Ответ на: комментарий от registrant27492

Но зачем собирать под 386-й если можно собрать из сорцов вариант с необходимыми тебе оптимизациями под текущую железку? Хотя, подход, конечно, не везде приемлемый.

alex4321
()
Ответ на: комментарий от anonymous

А что ты думаешь насчет того, что процессор будет инвалидировать кеш, когда он не должен этого делать?

anonymous
()
Ответ на: комментарий от anonymous

Чё это за набор неведомой херни? Нахрена выравнивать структуры по какой-то границе, нахрена всё остальное?

registrant27492
()
Ответ на: комментарий от alex4321

У пацанов бинарные дистры и всё бинарное - какое там им «собрать под текущую железку»? Поэтому у пацанов принято собирать под 386-й и не париться.

registrant27492
()
Ответ на: комментарий от anonymous

Естественно важнейший, если ты о ней нихрена не знаешь. Кроме 2 заклинаний «кешлайн» и «кешмис» - это все ассоциации, что рандомный адепт знает на слово «оптимизация». В реальном мире кешлайнами ты можешь только подтереться.

registrant27492
()
Ответ на: комментарий от Enthusiast

Работа с памятью внутри и снаружи процессора показана примерами на Си без привязки к компилятору.

Почитал(сколько же боли было в поиске этой вамулатуры на варезниках) - ничего интересно. Пол книги рассуждения о протухших конпелятор, а пол какой-то невнятной пасты из интеловских тулз.

Примеры на си - днище - хотя 2003год - оно и понятно. Смысла всё это принесёт в районе нуля. Лучше уж на мануал по оптимизации от вендора линковать.

registrant27492
()
Ответ на: комментарий от registrant27492

Ну да, то есть заморочиться написанием кода, который определяет, на чём запущен и выбрать соответсвующее ветвление (из числа предусмотренных на момент написания) - более целесообразно. Я конечно и сам скорее за бинарные дистры, но тут, кажется, ты преувеличиваешь. Ок, удачи им.

alex4321
()
Ответ на: комментарий от alex4321

ты преувеличиваешь.

Все пацаны орут, что нужны бинари - все. Хотя на них конечно можно покласть.

Тут ещё проблема в нормальном конпеляторе - у пацана стоит гцц3 - что ты с ним сделаешь? Тогда надо таскать за самой целую систему, чтобы на хосте собиралось.

Поэтому много бинарей выгодны ещё и этим.

registrant27492
()
Ответ на: комментарий от registrant27492

Нужны, безусловно. Если условия не заставляют нас заниматься уже даже не простым байтоебством, но с оглядкой на конкретное железо.

«Тогда надо таскать за самой целую систему, чтобы на хосте собиралось.» Пусть кросскомпиляет. Думаю, для задач где это даст критичный прирост производительности - это меньшая из проблем (или таки нет? Тут бы конкретные примеры).

Впрочем, хрен с ним всем.

alex4321
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.