Процессору можно подсказать наивероятный переход?

https://stackoverflow.com/questions/11514097/does-jvm-has-its-runtime-branch-...

post-factum ★★★★★
(23.12.18 20:36:21 MSK)

Наткнулся в расте на likely/unlikely.

В C/C++ это тоже есть.

~~RazrFalcon~~ ★★★★★
(23.12.18 20:49:24 MSK)

Ссылка

Ответ на: комментарий от post-factum 23.12.18 20:36:21 MSK

Ничоси! Разница в 6 раз https://stackoverflow.com/questions/11227809/why-is-it-faster-to-process-a-so... и этой оптимизации нет в JVM! Гребанные индусы, надо еще за GraalVM поинтеросоваться, может хоть там есть...

foror ★★★★★
(23.12.18 20:56:22 MSK) автор топика

свои вероятностные нейронки и прочий кремниевый хлам?

в книжки про процессоры писалось про два бита на адрес, выбранное два раза подряд направление и становится likely

а ещё процессор может оба направления в бранче начать исполнять, а потом неудачный отбросить.

dimon555 ★★★★★
(23.12.18 21:28:16 MSK)

Ответ на: комментарий от foror 23.12.18 20:56:22 MSK

В JVM, насколько я знаю, branch prediction работает в runtime, а не в compile time. В java это называется «разогревом» или «разминкой».

Sorcerer ★★★★★
(23.12.18 22:28:23 MSK)

Ссылка

Процессору можно подсказать наивероятный переход?

Нет нельзя. Современные x86 вообще не пользуются статическим предсказателем, только динамическим. Т.е. процессор после выборки команды перехода сразу начнет выбирать одну ветку (какую решит сам на основании своей статистики и повлиять на это нельзя).

Наткнулся в расте на likely/unlikely.

Они и в C/C++ есть (в ядре Linux появились, еще когда раста даже в задумке не было). Эти подсказки компилятору говорят, какая ветка должна быть в бинарнике скомпилирована сразу за командой перехода, а какая по адресу, куда произойдет переход (но какая ветка кода пойдет в конвейер процессора, решает динамический предсказатель). Таким образом likely ветка будет сразу за командой jCC и с большей вероятностью окажется в кеше, но предсказатель может выбрать unlikely ветку и тогда процессор начнет предвыборку другой ветки.

// какую ветку после jCC prefetch будет считывать - решает динамический предсказатель
    jCC l1
    // likely branch code (more likely to be in code cache)
    jmp end
l1: 
    // unlikely branch code
end:
    // other code

anonymous
(24.12.18 02:23:17 MSK)

Ответ на: комментарий от dimon555 23.12.18 21:28:16 MSK

в книжки про процессоры писалось про два бита на адрес, выбранное два раза подряд направление и становится likely

Книжки по программированию становятся неактуальны еще до публикации. Однако, статьи по работе предсказателей уже тоже не актуальны. В документации Intel теперь тоже не рассказывает подробностей (кроме общих фраз про нейронные сети).

anonymous
(24.12.18 02:27:53 MSK)

Ответ на: комментарий от anonymous 24.12.18 02:23:17 MSK

Современные x86 вообще не пользуются статическим предсказателем, только динамическим.

Странный выбор, по мне так было бы более логично использовать даже не статический предсказатель, а просто включать в команду ожидаемое значение.

В чём причина причина выбора динамических предсказателей?
Мне вот кажется что это просто распил денег потребителей.

torvn77 ★★★★★
(24.12.18 03:13:58 MSK)

Ответ на: комментарий от torvn77 24.12.18 03:13:58 MSK

Да нет там ничего магического, или подвоха. Ну смотри. Аноним всё правильно пишет. И в большинстве случаев выборка произойдет сразу после команды jCC, но некоторых случаях, обнаруженных интелом с помощью хаков, это не так. И что бы не формализовать эту эвристику поведения, которая ничего тебе не даст, по сути, а является микрооптимизацией на низком уровне, интел оставляет себе пространство для маневра, называя это в документации «динамическим предсказанием».

Deleted
(24.12.18 04:21:18 MSK)

Ответ на: комментарий от torvn77 24.12.18 03:13:58 MSK

по мне так было бы более логично использовать даже не статический предсказатель, а просто включать в команду ожидаемое значение.

Скорее ожидаемую ветку. Я тоже мечтаю о такой команде (в дополнение к существующим) или префиксе для существующих условных переходов. Иногда бывают ситуации, когда независимо от частоты выпадения условия нужно предпочтительной сделать всегда определенную ветку. Например при обработке ошибок, когда возвращается optional или пара <result,error> или код типа:

if( have_next() )
    process( get_data() );
else
    wait_for_data();

Тут нужно, чтобы process( get_data() ); загружался в конвейер процессора приоритетно, потому что мне безразлично, сколько потеряется тактов, если на самом деле выпадет ветка wait_for_data();.

anonymous
(24.12.18 09:34:34 MSK)

Ссылка

Ответ на: комментарий от Deleted 24.12.18 04:21:18 MSK

И в большинстве случаев выборка произойдет сразу после команды jCC, но некоторых случаях, обнаруженных интелом с помощью хаков, это не так.

Тут я хочу уточнить, что динамический предсказатель - это совсем отдельная часть процессора (отдельная от конвейера prefetch->decode->execute->write/commit). В том смысле, что уже на следующем такте после предзагрузки (prefetch) команды условного перехода будет загрузка (prefetch) предсказанной ветки. Т.е. предсказание происходит ДО стадии декодировки команды перехода. Частично поэтому и не используется статический предсказатель.

anonymous
(24.12.18 09:40:39 MSK)

Ссылка

Ответ на: комментарий от foror 23.12.18 20:56:22 MSK

Индусы просто не дурачки и понимают, что нет смысла заниматься чепухой, которую хочет автор темы. При программировании на Java приходится решать более важные и сложные вопросы, чем маргинальная оптимизация скорости.

Partisan ★★★★★
(24.12.18 09:44:45 MSK)

Ответ на: комментарий от Partisan 24.12.18 09:44:45 MSK

более важные и сложные вопросы, чем маргинальная оптимизация скорости

То-то, я запустил один in-memory Хешмап от одного ~~не дурачка~~ хипстера. Всё модно, молодёжно на Котлине даже написано. Вот только работает как черепаха и память у меня всю выжрала моментально, не хватило.

А потом, взял нормальную, оптимизированную Хешмапу, где оптимизации на уровне битов. И всё летает и в память всё влезло, даже осталось еще много свободной.

foror ★★★★★
(24.12.18 13:52:05 MSK) автор топика
Последнее исправление: foror 24.12.18 13:53:31 MSK (всего исправлений: 1)

Ответ на: комментарий от foror 24.12.18 13:52:05 MSK

тот хипстер - молодец, курсовик сдал благодаря своей хешмапе

а вот вам следует по рукам надавать, за то, что тянете всё подряд с гитхаба

anonymous
(24.12.18 14:49:16 MSK)

Ответ на: комментарий от foror 24.12.18 13:52:05 MSK

Всё модно, молодёжно на Котлине даже написано. Вот только работает как черепаха и память у меня всю выжрала моментально, не хватило.

А потом, взял нормальную, оптимизированную Хешмапу, где оптимизации на уровне битов. И всё летает и в память всё влезло, даже осталось еще много свободной.

Вторая реализация в java некорректна.

slovazap ★★★★★
(24.12.18 16:33:50 MSK)

Ответ на: комментарий от dimon555 23.12.18 21:28:16 MSK

а ещё процессор может оба направления в бранче начать исполнять, а потом неудачный отбросить.

Угу. А потом ядра плавятся.

Ivan_qrt ★★★★★
(24.12.18 16:54:28 MSK)

Ссылка

Ответ на: комментарий от slovazap 24.12.18 16:33:50 MSK

Вторая реализация в java некорректна.

Телепата подвезли?

foror ★★★★★
(24.12.18 17:43:41 MSK) автор топика

Ответ на: комментарий от anonymous 24.12.18 14:49:16 MSK

тот хипстер - молодец, курсовик сдал благодаря своей хешмапе

Если бы, человек за то поделие еще деньги не стесняется просить

foror ★★★★★
(24.12.18 17:44:28 MSK) автор топика

Ссылка

Ответ на: комментарий от foror 24.12.18 17:43:41 MSK

Не надо быть телепатом чтобы знать что в java все тормозит и жрёт память. Иное странно.

slovazap ★★★★★
(24.12.18 17:49:53 MSK)

Ссылка

Ответ на: комментарий от anonymous 24.12.18 02:27:53 MSK

(кроме общих фраз про нейронные сети).

нет там никаких неройнных сетей, два бита и так больше 90% дают

dimon555 ★★★★★
(24.12.18 23:01:04 MSK)

Ответ на: комментарий от torvn77 24.12.18 03:13:58 MSK

Странный выбор, по мне так было бы более логично использовать даже не статический предсказатель, а просто включать в команду ожидаемое значение.

Не «логично», а «так кажется». Не видно в заключениях логики.

А на деле префиксы для статического предсказания переходов уже были реализованы в Pentium 4. В других процессорах эффекта уже не наблюдалось. Не взлетело, видать.

i-rinat ★★★★★
(24.12.18 23:20:28 MSK)

Ссылка

Этот префикс (вероятного бранча) игнорируется в amd, а в intel влияет просто на начальное состояние предсказателя. Так что оптимизация сия сомнительна.

Алсо, в большенстве процов там простая state machine, без всяких нейросетей

~~deadplace~~ ★
(25.12.18 07:19:53 MSK)

Ссылка

Ответ на: комментарий от dimon555 24.12.18 23:01:04 MSK

В Zen появились нейронные сети. Хотелось бы знать, как это работает). Возможно, это просто маркетинговая уловка

~~deadplace~~ ★
(25.12.18 07:24:35 MSK)

Ответ на: комментарий от dimon555 24.12.18 23:01:04 MSK

(кроме общих фраз про нейронные сети).

нет там никаких неройнных сетей, два бита и так больше 90% дают

А чё ты мне это говоришь. Запости баг на документацию в AMD или куда еще...

anonymous
(25.12.18 20:10:23 MSK)

Ссылка

Ответ на: комментарий от anonymous 24.12.18 02:23:17 MSK

Современные x86 вообще не пользуются статическим предсказателем, только динамическим. Т.е. процессор после выборки команды перехода сразу начнет выбирать одну ветку (какую решит сам на основании своей статистики и повлиять на это нельзя)

А если статистики еще нет (или она уже выкинулась из кэша), то будет использована одна из веток, например первая. Атрибуты likely/unlikely позволяют сгенерировать ассемблер с ветками, идущими в порядке, предпочитаемом данным процом.

annulen ★★★★★
(25.12.18 22:22:56 MSK)

Ссылка

Ответ на: комментарий от deadplace 25.12.18 07:24:35 MSK

В Zen появились нейронные сети.

А точно нейросеть, а не перцептрон? Последний иногда называют нейросетью, но по факту из-за упрощённого алгоритма обучения поддерживает только 1 слой, т.е. простое увеличение коэффициентов эвристик, давших правильное предсказание и уменьшение эвристик давших ошибочное

khrundel ★★★★
(26.12.18 12:59:42 MSK)

Ответ на: комментарий от dimon555 24.12.18 23:01:04 MSK

Простой saturation counter 90% не дает, увы. Но на его основе делают другие предикторы, правда всего битов там куда больше. Вообще сейчас самый вменяемый предиктор, которые многие используют - TAGE.
Вот неплохая презенташка по предикторам: https://www.cs.cmu.edu/afs/cs/academic/class/15740-s17/www/lectures/L19-Branc...

Deleted
(26.12.18 14:00:23 MSK)
Последнее исправление: SMD 26.12.18 14:02:37 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от khrundel 26.12.18 12:59:42 MSK

вот совсем не разбираюсь в теме. Нашел такую статью http://faculty.cse.tamu.edu/djimenez/pdfs/hpca7_dist.pdf

Это может быть то, что amd взяла на вооружение, а может и нет

~~deadplace~~ ★
(27.12.18 10:16:07 MSK)

Ссылка

Похожие темы