Забавная новость про ошибку в интеловских процессорах

0

6

На опеннете появилась статейка в которой описывается баг CPU Intel на базе микроархитектуры Raptor Lake 13 и 14 поколений

Проблема возникала из-за того, что генератор кода LLVM использовал инструкцию «mov byte ptr [rsi + rdi + 1], ch» при записи в память результатов кодирования Хаффмана. При выполнении данной инструкции на CPU Raptor Lake вместо 8-15 битов из регистра RCX, соответствующих указанному в инструкции регистру CH, в память записывались биты 0-7, соответствующие регистру CL.

Охренеть! Как с таким багом оно работает?

Ссылка

← MrSugoma спамит в AUR

Лучший телефон для линуксоида →

Как с таким багом оно работает?

Очевидно данная комбинация инструкций редко используется.

devl547 ★★★★★
(17.06.26 20:40:50 MSK)

Ссылка

А если вместо rsi rdi другие регистры, или другое смещение вместо единицы, или вместо ch другой регистр из списка ah dh bh - тоже младшие биты запишет?

firkax ★★★★★
(17.06.26 20:44:12 MSK)

Ссылка

llvm bruh moment

mittorn ★★★★★
(17.06.26 20:48:17 MSK)

Ссылка

Как с таким багом оно работает?

Потому что CH и с ним подобные - страшное легаси, которое через mov будет выполняться не одной инструкцией, а тонной микроопераций (µops). Можно предположить, что

mov byte ptr [rsi + rdi + 1], ch

Будет декодирована в что-то типа

uop1: вычислить адрес RSI + RDI + 1
uop2: взять байт из RCX
uop3: положить байт в store buffer
uop4: позже записать store buffer в L1/cache/memory

И где-то в районе uop2 оно конкретно в этом пайпе обосралось, взяло не CH (8..15), а его близнеца с REX префиксом или просто CL (0..7).

Скорее всего даже не сам микрокод кривой, а из-за физических деформаций на производстве конкретно в этом месте в почти 100% вероятности есть деградация (наплыв/пробив/облысение) дорожки, что меняет путь получаемого байта. ЕМНИП это на рапторе были проблемы с перегревами/zlib-rs/deflate. Это ж вообще полуэкспериментальное поколение, что intel вынудили высрать на рынок.

Внесут патчи в LLVM/GCC, чтобы он бил на

mov eax, ecx
shr eax, 8
mov byte ptr [rsi + rdi + 1], al

Как будто первый такой патч в истории, ага. Там код LLVM/GCC на 90% состоит из подобных извратов, потому что железо - говно, архитектура - говно (особенно прикол с встречающимися стеком и кучей), выполнение данных как кода? Легко!

PPP328 ★★★★★
(17.06.26 21:01:27 MSK)
Последнее исправление: PPP328 17.06.26 21:01:40 MSK (всего исправлений: 1)

Ответ на: комментарий от PPP328 17.06.26 21:01:27 MSK

https://github.com/trifectatechfoundation/zlib-rs/pull/520/files

Тут пишут что mov mem,ch превращается в двухбайтовый mov и портит следующий байт.

Могу предположить что оно превращается в mov mem,cx но данных для гадания определённо недостаточно, да и комментарий по ссылке доверия не вызывает.

У кого-то же есть этот проц на лоре наверно? Можно ж проверить самим.

Потому что CH и с ним подобные - страшное легаси

С каких это пор он легаси? Вредители постарались?

firkax ★★★★★
(17.06.26 21:09:01 MSK)
Последнее исправление: firkax 17.06.26 21:10:08 MSK (всего исправлений: 1)

Ссылка

А ещё теория заговора.

Поскольку проявляется эта штука редко, возможно оно специально так запланировано и сделано под какую-то конкретную прогу, заведомо под этот баг попадающую и в результате у той проги могут ломаться какие-то механизмы безопасности, открывая бекдор.

firkax ★★★★★
(17.06.26 21:16:23 MSK)

Дак вы почитайте errata к процессорам современным. Полюбуйтесь на wontfix к заметной части багов. А это вполне возможно что микрокодом починят

cobold ★★★★★
(17.06.26 21:16:38 MSK)

Ссылка

Как будтво впервые. Представь себе свой ужас когда у тебя калькулятор не может 2 однозначных числа сложить.

ya-betmen ★★★★★
(17.06.26 21:51:33 MSK)

Ответ на: комментарий от firkax 17.06.26 21:16:23 MSK

Слишком ненадёжно.

Производственный цикл процессоров долгий. От внедрения бекдора до возможности эксплуатации пройдут годы.

Если софт за это время пересоберут новой версией компилятора или просто чуть-чуть с другими настройками оптимизации, то уязвимая инструкция может исчезнуть.

KivApple ★★★★★
(17.06.26 22:30:49 MSK)

Ответ на: комментарий от KivApple 17.06.26 22:30:49 MSK

Возможно таргетировано на какой-то энтерпрайз про который точно известно что его менять не будут. Или может быть авторы той проги участвуют в сговоре, но так чтобы оказаться в итоге невиноватыми т.к. баг не их. А интел тоже не виноват т.к. про ту прогу якобы не знал.

И тут не производственный цикл проца, а производственный цикл микрокода, это намного короче.

firkax ★★★★★
(17.06.26 22:42:43 MSK)
Последнее исправление: firkax 17.06.26 22:44:25 MSK (всего исправлений: 2)

Ответ на: комментарий от firkax 17.06.26 22:42:43 MSK

Или нацелено на проприетарщину какую-то. Или на какую-то криптографию на ассемблере.

shdown ★★
(17.06.26 22:45:59 MSK)

Ссылка

Ответ на: комментарий от firkax 17.06.26 21:16:23 MSK

Может быть.

sparkie ★★★★★
(17.06.26 23:24:51 MSK)

Ссылка

Ответ на: комментарий от ya-betmen 17.06.26 21:51:33 MSK

ужас когда у тебя калькулятор не может 2 однозначных числа сложить.

Напомнило «Машину Трурля» Лема:

— Я уничтожу Трурля! - сказала машина. - Но прежде пусть он ответит мне на вопрос, сколько будет два плюс два.

— Ах, ответит он тебе, и так, что ты будешь довольна и наверняка с ним помиришься, ведь правда же, Трурль? - успокаивающе заговорил посредник. - Ну конечно… - едва слышно произнес Трурль.

— Да? - сказала машина. - Так сколько будет два плюс два?

— Че… то есть семь… - еще тише проговорил Трурль.

No ★★★
(18.06.26 02:22:41 MSK)

Ссылка

А есть кто шарит в компиляторах? Почему так получилось. В LLVM 23 этот баг исправлен, а проявляется он в версии 22, как я понял из прочитанных постов.

IIIypuk ★★★★☆
(18.06.26 02:40:37 MSK)

Чот нифига не работает этот ваш баг https://hastebin.com/share/eturuxuyaw.asm Нихрена не могут сделать толком ржависты, даже баг. Зато новость разнести по интернетам это пожалуйста

cobold ★★★★★
(18.06.26 03:09:59 MSK)

Ответ на: комментарий от IIIypuk 18.06.26 02:40:37 MSK

Это баг процессора, а не компилятора.

unC0Rr ★★★★★
(18.06.26 08:04:48 MSK)

Ссылка

Ответ на: комментарий от cobold 18.06.26 03:09:59 MSK

У тебя проц «Raptor Lake 13 и 14 поколений» и прога вывела 11AA?

firkax ★★★★★
(18.06.26 08:12:51 MSK)

Как с таким багом оно работает?

«Никогда такого не было, и вот опять.» Тебе сколько лет?

А нужные люди в курсе.

sparkie ★★★★★
(18.06.26 08:26:56 MSK)

Ссылка

Ответ на: комментарий от firkax 18.06.26 08:12:51 MSK

В ноутбуке 1370p. То есть да, 13 поколение, raptor lake-p

cobold ★★★★★
(18.06.26 09:50:24 MSK)

Ответ на: комментарий от firkax 18.06.26 08:12:51 MSK

У меня вывело.

taskset -c 0 ./rpl_bug
11AA
cat /proc/cpuinfo
model name      : 13th Gen Intel(R) Core(TM) i7-13700KF

Не работает.

lenin386 ★★★★★
(18.06.26 09:52:33 MSK)
Последнее исправление: lenin386 18.06.26 09:52:50 MSK (всего исправлений: 1)

Ответ на: комментарий от cobold 18.06.26 09:50:24 MSK

А этот исходник по ссылке ты сам написал или это пример от исследователей бага?

Может там ещё какие-то условия, например перед buff дописать db 0 чтобы он был не выровнен по 2-байтовой границе. Или записывать значение не mov ecx,11ff а mov rcx,11ff. Или записывать его где-то в другом месте чтобы к моменту записи в память проц уже забыл когда он записывал значение в rcx.

firkax ★★★★★
(18.06.26 09:55:07 MSK)

Ответ на: комментарий от firkax 18.06.26 09:55:07 MSK

Сам написал. Прочитал пост на лоре. Взял инструкцию, которая указана и использовал её

cobold ★★★★★
(18.06.26 10:08:07 MSK)

Ссылка

Ответ на: комментарий от lenin386 18.06.26 09:52:33 MSK

Дедушка, там по ссылкам пишуть что воспроизводится на E-ядре(Gracemont). А 0 это скорее всего P. Не знаю как у тебя, но у меня нумерация такая - сначала все P ядра идут, потом все E

cobold ★★★★★
(18.06.26 10:10:22 MSK)

Ответ на: комментарий от cobold 18.06.26 10:10:22 MSK

Все пробовал, 0-23.

lenin386 ★★★★★
(18.06.26 10:20:33 MSK)

Охренеть! Как с таким багом оно работает?

Чем отличатся от: код тесты прошёл, в проде работает год-другой. А тут бац всплывает «Эффект последней строки».

AlexVR ★★★★★
(18.06.26 10:31:52 MSK)

Ссылка

Ответ на: комментарий от lenin386 18.06.26 10:20:33 MSK

В оригинальном посте написано, что либа фейлилась иногда, а не каждый раз. Смысла в этой программе нет, хоть бы в цикле крутилась инструкция, что ли.

unC0Rr ★★★★★
(18.06.26 12:10:48 MSK)

Ответ на: комментарий от unC0Rr 18.06.26 12:10:48 MSK

фейлилась иногда, а не каждый раз.

Если оно еще и тайминг-зависимое, то вообще удачи.
Это как у AMD во времена Llano целочисленный делитель иногда давал неправильный ответ. Пришлось его полностью отключать на уровне микрокода.

devl547 ★★★★★
(18.06.26 12:17:27 MSK)

Ссылка

Ответ на: комментарий от unC0Rr 18.06.26 12:10:48 MSK

Ну то есть обманули получается в новости? В ней ничего не написано не про цикл, ни про вероятность возникновения ошибки. В ней автор удивляется как вообще работает процессор с такой ошибкой в весьма рядовой инструкции

cobold ★★★★★
(18.06.26 14:23:54 MSK)
Последнее исправление: cobold 18.06.26 14:25:25 MSK (всего исправлений: 1)