Объясните сишную магию v2

2

4

В продолжение темы: Объясните сишную магию

Ковыряю сорцы Skia и наткнулся на такой забавный ужас (ссылка):

int fLastMoveToIndex = 5; // любое число
fLastMoveToIndex ^= ~fLastMoveToIndex >> (8 * sizeof(fLastMoveToIndex) - 1);

Экспериментально удалось выяснить, что данный код меняет знак и отнимает 1 только если число положительное. Как он это делает - я даже знать не хочу.

Вопрос: что мешало написать банальный if, или хотя бы оставить комментарий? Типичное сишное какерство?

PS: производительно данного куска кода на погоду не влияет.

Ссылка

←	clang или gcc кто прав в Си?

python-скрипт в какое-то время перестает перенаправлять email сообщения

→

← 1 2 3 4 5 6 →

Ответ на: комментарий от max_lapshin 28.07.20 14:45:31 MSK

На 3% за год? Тут некоторые товарищи с криокамерой помнят как в n раз в год ускорялось. Сейчас такого нет и не будет.

peregrine ★★★★★
(29.07.20 01:34:21 MSK)

Ответ на: комментарий от seiken 27.07.20 08:19:24 MSK

потому что он хейтит с и с++ поэтому и прицепил что типа сишное какерство. Читает код видимо чтобы переписывать на свой любимый недоязычёк.

bonta ★★★★★
(29.07.20 07:21:58 MSK)

Ответ на: комментарий от peregrine 29.07.20 01:34:21 MSK

гораздо больше.

Интел очень сильно ускоряет процессоры и количеством ядер, и внутренней архитектурой.

Сравнивать одночастотные процессоры сегодняшние и 5-летние просто смешно.

max_lapshin ★★★★★
(29.07.20 07:42:05 MSK)

Ответ на: комментарий от bonta 29.07.20 07:21:58 MSK

Какой слог! Сразу видно фанатика-неофита :)))

htower_ ★★
(29.07.20 07:52:12 MSK)

Ссылка

Тред не читал, но Hackers delight про подобные битовые хаки уже советовали?

anonymous
(29.07.20 08:48:13 MSK)

Ссылка

Ответ на: комментарий от max_lapshin 29.07.20 07:42:05 MSK

Интел очень сильно ускоряет процессоры и количеством ядер, и внутренней архитектурой. Нет, не сильно ускоряет. Последние 5 лет это все вариации скайлейка. Количество ядер(4/8 в 2016 вс 10/20 сейчас) это, конечно, хорошо, но амд объективно лучше.

anonymous
(29.07.20 08:51:01 MSK)

Ответ на: комментарий от bonta 29.07.20 07:21:58 MSK

Да я реторический вопрос задал. Понятно, что чел неадекват.

seiken ★★★★★
(29.07.20 16:53:56 MSK)

Ссылка

Ответ на: комментарий от max_lapshin 28.07.20 14:44:47 MSK

Заявляет тот кто на С ничего толкового не написал

А про оптимизации тем более не знает, лол

И в бложке отписывает как современные броузеры медленно файлы открывают

Видимо после переписывания оптимизаций в красивый код такими же «гениями» как вы ?

anonymous
(29.07.20 19:57:22 MSK)

Ответ на: комментарий от anonymous 29.07.20 19:57:22 MSK

Заявляет тот кто на С ничего толкового не написал

Ну давай, хвастай, маэстро! Наши глаза и уши открыты. Ведь ТЫ же не «тот, кто на С ничего толкового не написал»?

anonymous
(29.07.20 20:06:25 MSK)

Ссылка

Ответ на: комментарий от max_lapshin 29.07.20 07:42:05 MSK

Интел очень сильно ускоряет процессоры и количеством ядер, и внутренней архитектурой

Где факты, алеу? Я привел факты, корень десятой степени из двух — 7% в среднем роста производительности в год. Какие факты можешь противопоставить ты?

byko3y ★★★★
(29.07.20 20:21:59 MSK)

Ссылка

Ответ на: комментарий от anonymous 29.07.20 08:51:01 MSK

Количество ядер(4/8 в 2016 вс 10/20 сейчас) это, конечно, хорошо, но амд объективно лучше

Делать процессоры 14 нм с малым числом ядер тупо экономически невыгодно. По этой причине в процессор уже засунули северный мост и видеокарту — потому что проще засунуть бесполезные транзисторы на кристалл, чем выпускать кристалл без них по почти той же цене. Десятилетний переход с 32 нм на 14 нм дал рост частоты с 3.9 до 5.2 ГГц — это курам на смех, абсолютный предел транзисторов по частоте уже достигнут.

byko3y ★★★★
(29.07.20 20:27:28 MSK)

Ссылка

А вот просто интересно. На эльбрусе, наверное, можно и через условный оператор написать с той же эффективностью? Как я понимаю, на Эльбрусе нет такой проблемы, которая есть на интелях, что на интелях очень дорогая ошибка по условному переходу. На эльбрусах типа такие вещи параллелятся, и ошибка не стоит так дорого уже.

Кто может прокоментировать из специалистов, если таковые присутствуют здесь?

~~dave~~ ★★★★★
(30.07.20 07:45:29 MSK)

Комментарий не нужен. Код самодокументируемый.

perl5_guy ★★★★★
(30.07.20 08:26:13 MSK)

Ссылка

Ответ на: комментарий от dave 30.07.20 07:45:29 MSK

на интелях очень дорогая ошибка по условному переходу

Не знаю, почему ты берешь в пример эльбруас, а не передовые GPU, которые тоже имеют много элементов VLIW, или даже ARM с его условным выполнением в составе огромного числа инструкций.

На Cortex-M4 2010 года выпуска стоимость заполнения пайплайнов — 3 цикла максимум, однако, неправильное предсказание ветвления на Cortex-A15. Cortex-A57. Cortex-A72 стоит под 15 циклов. Как и у x86.

VLIW не используется где попало в GPU, потому что скорость выполнения у разных операций разная, и нет смысла совать деление и помещение значения в регистр в одну операцию. Потому в ARM и GPU независимые операции записываются различными инструкциями, а связанные операции могут быть записаны в одной инструкции, в том числе SIMD.

byko3y ★★★★
(30.07.20 08:28:45 MSK)

Ответ на: комментарий от byko3y 30.07.20 08:28:45 MSK

VLIW может загнать весь условный оператор if в одну инструкцию? И никаких хаков подобных вышеописанному не нужно тогда?

И мне интересен эльбрус гораздо больше, чем армы и gpu.

~~dave~~ ★★★★★
(30.07.20 09:21:05 MSK)

Ответ на: комментарий от dave 30.07.20 09:21:05 MSK

Чисто теоретически VLIW позволяет просто одновременно вычислить и условие и оба варианта и отбросить лишний вариант. Но как на практике это большой вопрос.

anonymous
(30.07.20 11:41:03 MSK)

Ссылка

Ответ на: комментарий от dave 30.07.20 09:21:05 MSK

загнать весь условный оператор if в одну инструкцию

Как-то наивно считать инструкции в настоящее время, когда инструкции - это многопараметрическое нечто.

anonymous
(30.07.20 11:56:40 MSK)

Ответ на: комментарий от anonymous 30.07.20 11:56:40 MSK

Не нравится слово «инструкция» - назови тогда словом «арбуз»

~~dave~~ ★★★★★
(30.07.20 13:21:05 MSK)

Ответ на: комментарий от dave 30.07.20 13:21:05 MSK

Не нравится слово «инструкция» - назови тогда словом «арбуз»

Тогда переиначу вопрос: какую (оптимизационную) задачу решаешь, считая количество инструкций: бинарный размер кода, количество строк асм-кода, время выполнения кода, что-то еще?

anonymous
(30.07.20 13:36:47 MSK)

Ответ на: комментарий от anonymous 30.07.20 13:36:47 MSK

Товарищ, что ты ко мне пристал? Читай выше, что я написал. Что мне было интересно, то я узнал. Отстань уже от меня.

~~dave~~ ★★★★★
(30.07.20 13:52:47 MSK)

Ответ на: комментарий от dave 30.07.20 13:52:47 MSK

Интересно даются познания. Твое сообщение-вопрос Объясните сишную магию v2 (комментарий) осталось без ответа.

Ты пытаешься сложную последовательность зависимых действий собрать в одну инструкцию vliw (что-то вроде атомарного compare-and-swap). Вообще-то vliw задуман для компоновки в одну инструкцию незвисимых действий, которые параллельно раскидываются по исполнительным блокам. Я не отрицаю, что при желании можно собрать зависимые действия в одну составную инструкцию, но будет ли такая составная инструкция удовлетворять требованиям независимости времени выполнения от данных (или что ты хочешь получить от сего действия).

anonymous
(30.07.20 14:18:11 MSK)

Ссылка

Ответ на: комментарий от fsb4000 27.07.20 13:38:24 MSK

Могу предположить что код подготовили для сборки на платформах/компиляторах которые не могут оптимизировать. А вообще есть же сверху (в #if 0) пояснение для тех кто не осилил манипуляции с битами. Можно было бы ещё в макрос это запрятать.

GuruOfTheWeb
(31.07.20 22:50:28 MSK)

Ссылка

Ответ на: комментарий от peregrine 29.07.20 01:34:21 MSK

закон мура больше не работает (устал).

anonymous
(01.08.20 04:59:16 MSK)

Ссылка

Ответ на: комментарий от max_lapshin 29.07.20 07:42:05 MSK

Я на штеуде с 2003 года и менял проц 4 раза с тех пор, теперь 5 назревает. Профит был до 10 года, после слабый прирост производительности, ну а сейчас хочу менять, т.к. vt-d и vt-x нужны, а на i7-3770K vt-d нету, но теперь штеуд в пень и буду на amd собирать.

peregrine ★★★★★
(02.08.20 03:43:27 MSK)

Ссылка

Ответ на: комментарий от seiken 27.07.20 08:19:24 MSK

Подтверждаем.

composite = (pixel[0] & 243) | ((((min(95, max(0, color - 80))) // 32) << 2) ^ 8)

    luma = pixel[0] & 243
    color = 80 + ((pixel[0] >> 2 & 3) ^ 2) * 32

А как ещё-то?

~~mertvoprog~~ ☆
(03.08.20 12:54:29 MSK)
Последнее исправление: mertvoprog 03.08.20 12:55:00 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от a1batross 28.07.20 16:47:04 MSK

Я был бы рад увидеть ЛОР без анонимусов

Анонимус, рад был бы видеть ЛОР без тебя, но тогда, наверное, форум окончательно превратится в помойку. Лучше уж такие модераторы как ты, чем вообще никаких.

anonymous
(07.08.20 18:11:57 MSK)

Ссылка

Как он это делает - я даже знать не хочу.

fail. ты ещё скажи, что обратный квадратный корень про алгоритм Ньютона из движка Quake //you not supposed to understand this неинтересно.

битхаки же. ничего сложного. распиши на бумажке, станет нагляднее.

anonymous
(07.08.20 19:20:02 MSK)

Ответ на: комментарий от anonymous 07.08.20 19:20:02 MSK

про алгоритм Ньютона из движка Quake

Я даж разочарован. Метод ньютона не является самым быстрым алгоритмом. Приблизительный подсчет через "(1 + a) * (1 << (n >> 1)) >> 1" (где n — позиция старшего бита, a — результат деления на 2^2n) с таблицами коррекции будет пошустрее и безо всяких делений, которые необходимы с алгоритмом ньютона и которые ни разу не быстрые. Ровно как небыстрое и само аппаратное извлечение корня. По сути метод ньютона превращает аппаратное деление в извлечение корня.

byko3y ★★★★
(08.08.20 06:09:13 MSK)
Последнее исправление: byko3y 08.08.20 06:13:36 MSK (всего исправлений: 1)

Ответ на: комментарий от byko3y 08.08.20 06:09:13 MSK

и безо всяких делений

Делить? А на 0,5 домножить не судьба?

anonymous
(08.08.20 06:35:16 MSK)

Ответ на: комментарий от anonymous 08.08.20 06:35:16 MSK

Делить? А на 0,5 домножить не судьба?

В методе Ньютона для квадратного корня (метод Герона) нужно делить исходный аргумент на предыдущее предположение, а это чистейшее деление, безо всяких возможностей упрощения.

byko3y ★★★★
(08.08.20 16:07:59 MSK)