Оптимизация деления uint_32 на константу на современных 64-битных процессорах.
trivia:
предложен алгоритм для ускорения операции деления uint_32 на константу посредством использования 64-разрядных инструкций в современных процессорах.
В LLVM-Clang уже есть, в gcc тестируется.
Описание, разбор и тесты есть по ссылке на статью в arxiv.org ниже.
перевод и некоторые детали на хоботе
статья на arxiv.org
*в новостях за март не нашёл.
upd. https://github.com/ridiculousfish/libdivide - решение уровня проекта, со знаковыми и беззнаковыми int{32,64}