CPU, L2 Cache. Кто может просвятить?

Яндекс говорит, что L2 общий для всех ядер процессора.

Что происходит, когда мы через биос отключаем некоторые ядра? Например, оставляя 6 из 8. Оставшимся 6 ядрам достанутся все 2.0мб кэша (речь о зионах по 8 ядер) Или только 1.5, и часть л2 кэша будет пустовать?

Что вообще происходит, когда мы отключаем у последних интелов ядра через биос?

Ссылка

← Можно ли программно отключить аппаратные кнопки тачпада (ЛКМ, ПКМ)?

Посоветуйте принтер →

← 1 2 →

Яндекс говорит, что L2 общий для всех ядер процессора.

Общий значит общий, все ядра могут писать в любую линию. Теоретически™ может статься так, что каждое ядро «владеет» своим куском и при его выключении этот кусок становится недоступным. Самый простой способ проверить, так ли это — сделать тесты на скорости записи. По провалам и изломам графиков можно определить эффективный размер кэша.

Вот тут подробнее можно почитать: http://www.ixbt.com/cpu/rmmt-l2-cache.shtml

i-rinat ★★★★★
(23.07.13 20:28:53 MSK)

Ответ на: комментарий от i-rinat 23.07.13 20:28:53 MSK

Пойду почитаю. http://habrahabr.ru/qa/43932/ тут я подробнее все расписал (+ как выяснилось на 12\16 ядрах скорость именно одинаковая).

~~dk-~~ ☆
(23.07.13 20:31:41 MSK) автор топика

Ссылка

Вроде ж всё равно от раздутого кэша профит мизерный и/или редкий.

anonymous
(24.07.13 04:02:48 MSK)

Ссылка

Из нулевого рейда сделай рейд первого уровня и протестируй снова. Кстати, был бы смысл попробовать и опенсорсные решения - то, что они тормозили на твоём дорхлом компе, не означает, что статус-кво не изменится в их пользу на нормальной машине.

anonymous
(24.07.13 05:00:15 MSK)

Или только 1.5, и часть л2 кэша будет пустовать

Ох линукс линукс...

anonymous
(24.07.13 11:28:42 MSK)

Ссылка

Кто может просвятить?

РПЦ

registrant ★★★★★
(24.07.13 11:32:55 MSK)

L2 общий для всех ядер процессора.

Смотря какой процессор. У последних AMD он разделен по модулям (по 2 метра на модуль).

Что вообще происходит, когда мы отключаем у последних интелов ядра через биос?

Отключаются ядра. Кэш остается, он там динамически распределяется между ними.

devl547 ★★★★★
(24.07.13 11:35:44 MSK)

Ответ на: комментарий от anonymous 24.07.13 05:00:15 MSK

Для чистоты опыта пойду хугин еще раз попробую.

~~dk-~~ ☆
(24.07.13 11:53:37 MSK) автор топика

Ссылка

Ответ на: комментарий от devl547 24.07.13 11:35:44 MSK

Т.е. предположение о том, что у E5-2660 отключение ядер распределяет _весь_ л2-кэш между оставшимися активными ядрами, верно?

~~dk-~~ ☆
(24.07.13 11:54:28 MSK) автор топика

Ответ на: комментарий от dk- 24.07.13 11:54:28 MSK

отключение ядер распределяет _весь_ л2-кэш между оставшимися активными ядрами, верно?

Не совсем. Распределение _динамическое_ во время работы (емнип, маркетоиды это Intel SmartCache обозвали).

devl547 ★★★★★
(24.07.13 12:03:23 MSK)

Ссылка

Ответ на: комментарий от anonymous 24.07.13 05:00:15 MSK

В чем суть смены уровя рейда? Зачем зеркало?

Про опенсорсный хугин: Он тупо висит на стадии импорта 684 фоток по 18мп.

За 15 минут он записал на диск всего 230 байт (т.е. кэшей не родил, а должен по идее)

Прочел всего 3 гигабайта (а сырья на 6.5).

Подожду еще полчаса. Может просто его морда висит, а сам он работает.

~~dk-~~ ☆
(24.07.13 12:11:13 MSK) автор топика

Ответ на: комментарий от registrant 24.07.13 11:32:55 MSK

РПЦ

Розенталя мне внутривенно(

~~dk-~~ ☆
(24.07.13 12:13:41 MSK) автор топика

Ссылка

Ответ на: комментарий от dk- 24.07.13 12:11:13 MSK

В чем суть смены уровя рейда? Зачем зеркало?

Он лучше работает на чтение из многих потоков: разные задания параллелятся по разным накопителям, а последовательное чтение намного быстрее чем разбросанное. По твоей диагностике этого не установить, но есть вероятность что у тебя много ядер, читающих каждое свои данные вызывают тормоза из-за постоянного перепозиционирования головок в то время как было бы выгоднее читать файлы последовательно целиком.

Про хугин - будем надеяться что эксперты подтянутся, ЕМНИП там скорость сильно зависела от используемых опций.

anonymous
(24.07.13 12:27:05 MSK)

Просто для примера, на Q9300 6Мб разбито по 3Мб на две пары ядер.

backbone ★★★★★
(24.07.13 12:31:57 MSK)

Ссылка

Ответ на: комментарий от anonymous 24.07.13 12:27:05 MSK

Тесты (хоть и на других процессорах) при использовании ссд для чтения и сырья и даже рамдиска (! надо с рамдиском затестить еще) показали, что процессор все равно полностью не выедается.

Но поковыряться стоит, да.

Хугин... Не вижу в нем опции «выровнять по сетке» (т.е.задать количество рядов и столбцов). Просто загружены жипеги и все. Ни сетки, ни контрольных точек, ни превьюшки грубой.

Ну и «висел» то же время, за которое пятигуй успевает и выровнять и контрольные точки найти.

~~dk-~~ ☆
(24.07.13 12:34:27 MSK) автор топика

Ответ на: комментарий от dk- 24.07.13 12:34:27 MSK

Насколько я понял тот топик, твои тесты показывают что с увеличением степени параллелизма у тебя появляются какие-то потери. С кешом ты сделать ничего не сможешь, а с конфигурацией дисков можешь поэкспериментировать. Ну или действительно загнать всё на рамдиск и посмотреть выровняется производительность или нет - не выровняется, значит не в диск упирается.

В хугине ты, видимо, визардом пользуешься - поэтому он за тебя всё пытается сделать и много думает при этом.. Не уверен насчёт сетки, а контрольные точки и превью там нормальные (кстати непонятно зачем сетка когда нужно просто расставить КТ и он всё выровняет по ним) - просто создавай пустой проект, без визарда и закидывай фотки в проект вручную.

anonymous
(24.07.13 13:01:44 MSK)

Ответ на: комментарий от anonymous 24.07.13 13:01:44 MSK

684 фотки вручную?! а 6600 фоток (как в будущей панораме) нет уж.

Уточню: Я не утверждаю, что для гигапикселей хугин говно. Я просто не могу пока судить. Но для обычных панорам я от него отказался весьма взвешенно.

Касательно гигапикселей:

Очень экономит время и нервы такая штука пятигуя.

Я скормил ему 684 жипега. Он их сожрал. И ждет: либо я укажу ему самому их ровнять (хрен выровняет, особенно кадры где только небо или только вода, и ничего более), либо вручную указаваю «тут 36 столбцов по 19 кадров, первый кадр вверху слева, снималось рядами сверху вниз». И задаю процент перекрытия между кадрами (он тоже известен)

И все - у меня в окне превью уже грубая картинка. Я вижу не было ли дропнутых кадров при съемке, корректно ли они расположены, и т.п.

После этого запускается поиск точек. И он идет очень быстро.

~~dk-~~ ☆
(24.07.13 13:12:44 MSK) автор топика

Ответ на: комментарий от anonymous 24.07.13 13:01:44 MSK

В «главном окне» кнопка «загрузить снимки». Жму, загружаю, долго жду пока «отвиснет». Потом вышеописанные проблемы (где сетка?!)

~~dk-~~ ☆
(24.07.13 13:17:50 MSK) автор топика

Ответ на: комментарий от dk- 24.07.13 13:17:50 MSK

Ради хохмы скормил ему файл проекта от пятигуя. Жду пока отвеснет. Вроде должно открыть.

~~dk-~~ ☆
(24.07.13 13:18:56 MSK) автор топика

ПросвЯтить тебя никто здесь не сможет... кармы маловато )))

xterro ★★★★★
(24.07.13 13:22:28 MSK)

Ссылка

Яндекс говорит, что L2 общий для всех ядер процессора

Врет. Общий на два ядра был у Core 2 Duo, и сейчас в AMD, если считать модуль за два ядра. Core 2 Duo это давало профит, так как при отсутствии кэша третьего уровня и интегрированного в процессор северного моста данные между ядрами пришлось бы гонять через материнку. Собственно в Core 2 Quad Q6600 так и делалось (это было фактически два процессора Core 2 Duo под одной крышкой).

Что вообще происходит, когда мы отключаем у последних интелов ядра через биос?

Привязанный к ядрам L2 кэш отключается.

Archer73 ★
(24.07.13 15:28:08 MSK)

Яндекс говорит, что L2 общий для всех ядер процессора.

Вообще-то, это деталь реализации конкретной модели процессора.

annulen ★★★★★
(24.07.13 15:30:34 MSK)

Ссылка

Ответ на: комментарий от Archer73 24.07.13 15:28:08 MSK

А применительно к E5-2660?)

~~dk-~~ ☆
(24.07.13 15:42:15 MSK) автор топика

Ссылка

Ответ на: комментарий от anonymous 24.07.13 13:01:44 MSK

с увеличением степени параллелизма у тебя появляются какие-то потери

Да никаких вопросов нет вообще. L2 хоть и шаренный, однако любому даже линуксоиду очевидно что на х*й86 он инклюзивный. Соотвественно чем больше ядер, тем больше копий L1 там сидит -> места меньше, инвикшен чаще...

anonymous
(24.07.13 15:51:19 MSK)

Ответ на: комментарий от anonymous 24.07.13 15:51:19 MSK

А можно для глупой белки попроще изложить? В реалиях х86_64 от интела (Е5-2660)

~~dk-~~ ☆
(24.07.13 15:57:30 MSK) автор топика

Ответ на: комментарий от anonymous 24.07.13 15:51:19 MSK

места меньше, инвикшен чаще...

Зато эвикш проще и быстрее. AMD делали эксклюзивный, но видать на кэшах больше 256-512k накладные расходы становится слишком высокими.

i-rinat ★★★★★
(24.07.13 16:00:48 MSK)

Ответ на: комментарий от anonymous 24.07.13 15:51:19 MSK

ну вот он попробует на рамдрайве погонять, если не поможет - можно будет грешить на кеши или межпоточное взаимодействие.

anonymous
(24.07.13 16:01:08 MSK)

Ответ на: комментарий от dk- 24.07.13 15:57:30 MSK

Шаренные кеши бывают двух подвидов - инклюзивный L2 кеш хранит копии локальных кешей ото всех ядер. Эксклюзивный - нет.

Есть плюсы первого над вторым, есть минусы. Один из минусов что копия занимает место.

anonymous
(24.07.13 16:03:10 MSK)

Ссылка

Ответ на: комментарий от anonymous 24.07.13 16:01:08 MSK

Есть мнение, что на стадии сшивки межпоточное взаимодействие почти пофигу.

Т.к. каждый элемент (кадр) зависит лишь от соседних, и не зависит от остальных. Т.е. параллель хоть на сколько.

А вот на стадии блендинга связи «все со всеми».

Но это теории.

~~dk-~~ ☆
(24.07.13 16:03:53 MSK) автор топика

Ссылка

Ответ на: комментарий от i-rinat 24.07.13 16:00:48 MSK

Ну мы все понимаем что необходимо соблюдать некий баланс определённый на моделировании.

Топикстартеру Дреппера, cachegrind и perf.

anonymous
(24.07.13 16:05:50 MSK)

Ответ на: комментарий от anonymous 24.07.13 16:05:50 MSK

Топикстартеру Дреппера, cachegrind и perf.

У топикстартера софт только под Windows. Там туговато с cachegrind и perf.

i-rinat ★★★★★
(24.07.13 16:07:11 MSK)

Ответ на: комментарий от i-rinat 24.07.13 16:07:11 MSK

Его проблемы.

anonymous
(24.07.13 16:09:15 MSK)

Ответ на: комментарий от anonymous 24.07.13 16:09:15 MSK

А, Intel VTune тогда ему.

anonymous
(24.07.13 16:11:20 MSK)

Ответ на: комментарий от anonymous 24.07.13 16:09:15 MSK

Под линукс нужного софта нет. Есть только под макось.

Есть другой софт, там бинарь и под линукс, но тот софт сам по себе на 20-30% тормознее.

~~dk-~~ ☆
(24.07.13 16:13:20 MSK) автор топика

Ответ на: комментарий от dk- 24.07.13 16:13:20 MSK

Ну DTrace тогда уж, чё. И qcachegrind + Graphviz.

anonymous
(24.07.13 16:15:18 MSK)

Ответ на: комментарий от anonymous 24.07.13 16:15:18 MSK

А вообще в портах есть и valgrind и kcachegrind.

anonymous
(24.07.13 16:15:56 MSK)

Ссылка

Ответ на: комментарий от dk- 24.07.13 13:12:44 MSK

для обычных панорам я от него отказался весьма взвешенно.

вендософт решает, я правильно понимаю?

пищаль...

Rastafarra ★★★★
(24.07.13 16:17:12 MSK)

Ответ на: комментарий от Rastafarra 24.07.13 16:17:12 MSK

У вас линукс головного мозга.

anonymous
(24.07.13 16:18:05 MSK)

Ответ на: комментарий от anonymous 24.07.13 16:09:15 MSK

Его проблемы.

Нее, это проблемы опенсорса, что в нём нет приложений, нужных пользователю, а есть только тормозной хугин, 8-ми разрядный гимп и страшно глючный толи опен- толи либре-офис.

anonymous
(24.07.13 16:18:55 MSK)

Ответ на: комментарий от Rastafarra 24.07.13 16:17:12 MSK

конкретно в том случае - да.

юзабилити несравнимое.

если к работе с «гигапикселями» у меня еще есть вопросы к своему софту, то в обычных мелких панорамках мне тупо нечего еще хотеть.

~~dk-~~ ☆
(24.07.13 16:20:36 MSK) автор топика

Ответ на: комментарий от anonymous 24.07.13 16:18:05 MSK

У вас линукс головного мозга.

у меня острая нехватка скилов. спрашиваю вот.

Rastafarra ★★★★
(24.07.13 16:20:57 MSK)

Ссылка

Ответ на: комментарий от Rastafarra 24.07.13 16:17:12 MSK

но это вопрос к разработчикам.

под макось то бинарник есть. значит и под линукс можно.

~~dk-~~ ☆
(24.07.13 16:21:15 MSK) автор топика

Ссылка

Ответ на: комментарий от dk- 24.07.13 16:20:36 MSK

в обычных мелких панорамках

это кадров на 10? :)

Rastafarra ★★★★
(24.07.13 16:21:47 MSK)

Ответ на: комментарий от anonymous 24.07.13 16:18:05 MSK

У вас линукс головного мозга.

У него просто линукс. ТС достаточно чётко обозначил причины по которым он вынужден пробавляться вендозным софтом, что только человек с полным отсутствием ГМ мог не понять суть проблемы.

anonymous
(24.07.13 16:21:52 MSK)