Опубликован эмулятор архитектуры Эльбрус на основе QEMU

7

4

МЦСТ выпустила эмулятор QEMU для архитектуры E2K. Теперь программы для Эльбруса можно запускать на компьютерах с архитектурой x86‑64. Это откроет платформу для профессионалов, исследователей и энтузиастов, а также упростит разработчикам сборку и тестирование ПО.

Эмулятор qemu-e2k обеспечивает возможность, используя операционную систему семейства Linux запускать прикладные программы для операционных систем семейства Linux в машинных кодах Эльбрус (e2k) на компьютере архитектуры x86-64.

Предполагаемые сценарии использования эмулятора:

• Запуск готовых программ в машинных кодах процессоров Эльбрус для ознакомления с возможностями архитектуры и программной экосистемы, без использования физического оборудования с процессорами Эльбрус;

• Запуск компилятора для архитектуры Эльбрус в нативном окружении (в двоичных кодах процессоров Эльбрус), но на процессорах с архитектурой x86-64, без использования кросс-компиляции;

• Локальная или распределённая сборка на серверах с архитектурой x86-64 дистрибутивов операционных систем в машинных кодах процессоров Эльбрус, также без использования кросс-компиляции.

Подробное описание возможностей и ограничений первой версии эмулятора приведено в «Руководстве пользователя».

https://git.openelbrus.ru/mcst/qemu

Скачать материалы можно на сайте для разработчиков в разделе «Загрузки».

https://dev.mcst.ru/download/

QEMU — это универсальное средство эмуляции различных процессорных архитектур, а также средство запуска виртуальных машин (гипервизор). Для каждой целевой архитектуры предусматривается 2 варианта эмулятора:

qemu-system — эмулятор уровня системы, позволяющий запустить целую операционную систему, такую как Linux;
qemu-user (он же qemu-linux, он же просто qemu) — эмулятор уровня приложений, позволяющий запустить гостевое приложение внутри хозяйской операционной системы (Linux).

На данный момент поддержка архитектуры Эльбрус реализована во втором варианте — на уровне прикладных программ Linux; ведется работа над эмулятором уровня системы.

>>> Исходные тексты QEMU от АО "МЦСТ"

Ссылка

← NVIDIA отказалась от проприетарной лицензии для Tile IR

Numbat 1.17.0 →

← 1 2 3 4 5 6 →

Ответ на: комментарий от Xintrea 02.01.26 18:25:13 MSK

staa реализованы. ldaa нет, но они не нужны, по крайней мере я не встречал их использования в коде.
stap и ldap нужны для защищённого режима, но он вроде и так не поддерживается.

numas13 ★
(06.01.26 12:25:50 MSK)

Ответ на: комментарий от numas13 06.01.26 12:25:50 MSK

staa реализованы. ldaa нет, но они не нужны

А почему так происходит? Запись нужна, а чтение - нет. Шо за дичь?

Xintrea ★★★★★
(06.01.26 12:31:39 MSK)

Ответ на: комментарий от Xintrea 06.01.26 12:31:39 MSK

Чтение массивов выполняется инструкциями mova* (перемещает данные из APB в регистр и может дополнительно продвигать указатель дальше). Эти инструкции идут отдельно в свои специализированные каналы (если это можно так назвать), а не в универсальные АЛК0-5.

numas13 ★
(06.01.26 12:52:02 MSK)

Ответ на: комментарий от numas13 06.01.26 12:52:02 MSK

То есть, чтение массивов через APB - это норм, а запись через APB - моветон?

Xintrea ★★★★★
(06.01.26 13:50:44 MSK)

Ответ на: комментарий от Xintrea 06.01.26 13:50:44 MSK

APB (Array Prefetch Buffer) это префетч буффер, в него не записывают, а только читают.

Вообще, похоже есть недопонимание как это всё работает в Эльбрусах. Поясню кратко и своими словами.

У каждого ядра есть AAU (Array Access Unit). Это устройство условно состоит из:

AAU регистров в которые входят: дескрипторы массивов, индексы, инкременты и прочая лабуда для работы APB.
APB - это буфер куда асинхронно основной программе кладуться данные напрямую из L2.

staa инструкции используют базу из дескрипторов массивов и индексы чтобы записывать данные в память (так же как st). Так же эти инструкции могут продвигать индекс. staa используются для записи в AAU регистры, чтобы потом можно было запустить асинхронную подкачку массивов в APB.

ldaa по факту идентична обычному обращению с ld, но адрес вычисляется из дескриптора массива и индекса (по аналогии с staa), ну и дополнительно можно продвинуть индекс. Так же она используется для чтения AAU регистров, что нужно в ядре, но не в пользовательском коде. По крайней мере я не встречал такого пользовательского кода пока писал эмулятор. Эта инструкция кодируется в обычных АЛК и до появления аппаратного префетча не представляет никакой ценности. Да даже с аппаратным префетчем всё тоже самое можно делать с mova (ещё и данные будут префетчиться), а в 4-х освободившихся АЛК делать полезную работу.

mova инструкции перемещают данные из APB в регистровый файл и дополнительно могут продвинуть индекс. Данные в APB попадают асинхронно основному исполнению по заранее подготовленной программе с указанием дексрипторов массивов, индексов, смещением, инкрементов и прочей информацией. Программа для префетчера задаётся отдельной инструкцией ldisp и запускается инструкцией bap.

numas13 ★
(06.01.26 14:53:39 MSK)

Ответ на: комментарий от gns 05.01.26 12:06:31 MSK

Там же конвеер…

sabacs
(06.01.26 18:27:24 MSK)

Ответ на: комментарий от sabacs 06.01.26 18:27:24 MSK

Чот не верится в длинный конвейер в вакууме. :) У меня довольно старые знания о технологии производства микросхем, примерно пятнадцатилетней давности. Может сейчас уже и конвейер, но тогда на многих фабах роботы пластины между постами по воздуху перевозили.

gns ★★★★★
(06.01.26 18:33:05 MSK)

Ответ на: комментарий от gns 06.01.26 18:33:05 MSK

Вакуум только при использовании EUV-литографии. Всё остальное «на воздухе».

sabacs
(06.01.26 18:41:28 MSK)

Ответ на: комментарий от numas13 06.01.26 14:53:39 MSK

ldaa по факту идентична обычному обращению с ld, но адрес вычисляется из дескриптора массива и индекса (по аналогии с staa), ну и дополнительно можно продвинуть индекс.

То есть, тут начинает работать что-то типа принципов работы RISC: зачем нам иметь отдельный машкод для CALL и RET, когда мы то же самое можем сделать, напрямую управляя регистрами PC и SP? Тем более что и CALL и RET будут по тактам совпадать с выполнением прямых команд работы с регистрами?

ldaa Эта инструкция кодируется в обычных АЛК и до появления аппаратного префетча не представляет никакой ценности. Да даже с аппаратным префетчем всё тоже самое можно делать с mova (ещё и данные будут префетчиться), а в 4-х освободившихся АЛК делать полезную работу.

Не понял, с mova ведь АЛК будут заняты, с чего бы они освободились? Они освободятся только с ldaa + префетчер. Разве нет?

Xintrea ★★★★★
(06.01.26 19:01:23 MSK)

Ответ на: комментарий от sabacs 06.01.26 18:41:28 MSK

Даладно! И ионная полировка пластин? И легирование переходов всяким там индием и галлием?

gns ★★★★★
(06.01.26 19:14:46 MSK)

Ответ на: комментарий от gns 06.01.26 19:14:46 MSK

Ну это в вакууме… :)

sabacs
(06.01.26 19:24:11 MSK)

Ссылка

Ответ на: комментарий от Xintrea 06.01.26 19:01:23 MSK

Не понял, с mova ведь АЛК будут заняты, с чего бы они освободились?

Заняты будут как раз с ldaa, которые идут в АЛК0/2/3/5.

Ещё раз процицитирую своё прошлое сообщение.

Чтение массивов выполняется инструкциями mova* (перемещает данные из APB в регистр и может дополнительно продвигать указатель дальше). Эти инструкции идут отдельно в свои специализированные каналы (если это можно так назвать), а не в универсальные АЛК0-5.

Читай внимательнее.

numas13 ★
(06.01.26 20:02:40 MSK)

Ответ на: комментарий от numas13 06.01.26 20:02:40 MSK

Заняты будут как раз с ldaa, которые идут в АЛК0/2/3/5.

Мммм... ldaa создан специально, чтобы работать с APB? Или mova создан специально, чтобы работать с APB?

Xintrea ★★★★★
(06.01.26 20:08:05 MSK)

Ответ на: комментарий от Xintrea 06.01.26 20:08:05 MSK

Или mova создан специально, чтобы работать с APB?

this.

Это уже четвёртое сообщение в котором я пытаюсь тебе это объяснить. :)

numas13 ★
(06.01.26 20:14:23 MSK)

Ответ на: комментарий от Xintrea 06.01.26 20:08:05 MSK

Смотри на это так:

Настроиваешь src массив (псевдокод staa %aad0).
Настраиваешь dst массив (staa %aad1).
Говоришь где лежит программа для APB (ldisp fapb %aad0, bla, bla).
Запускаешь префетч (bap)
Ждёшь 15 тактов (если я правильно помню).
В цикле читаешь из src (APB, mova %aad0) и пишешь в dst (L1d(write-through)->L2, staa %aad1).

numas13 ★
(06.01.26 20:24:31 MSK)

Ссылка

Ответ на: комментарий от numas13 06.01.26 20:14:23 MSK

Вроде как APB появился в архитектуре Эльбрус v.6. Значит ли это, что дистр для v.5 просто не имеет инструкций mova, а значит использует ldaa, и поэтому не заведется на эмуляторе?

Xintrea ★★★★★
(06.01.26 20:25:07 MSK)

Ответ на: комментарий от Xintrea 06.01.26 20:25:07 MSK

Вроде как APB появился в архитектуре Эльбрус v.6

Нет, APB там с самого начала. В v7 по планам должен появиться аппаратный префетчер.

numas13 ★
(06.01.26 20:26:16 MSK)

Ссылка

Ответ на: комментарий от Xintrea 06.01.26 20:08:05 MSK

Вот маленький пример как оно работает. Поставил v7 т.к. там меньше заморочек и генерирует более понятный код чтобы сильно не запутывать тебя. Смотри на моё предыдущее сообщение и ищи в сгенерированном ассемблере соотвестветствующий код. Там не сложно разобраться.

https://ce.mentality.rip/z/x4WdKE

Пы.Сы.

mova area=N это наш aadN

aaurw это на самом деле staa+mas, псевдоинструкция.

numas13 ★
(06.01.26 20:35:11 MSK)
Последнее исправление: numas13 06.01.26 20:36:50 MSK (всего исправлений: 3)

Ответ на: комментарий от numas13 06.01.26 20:35:11 MSK

чтобы сильно не запутывать тебя

У Эльбруса мнемотика команд такая, что я хрен что понимаю. И я не нашел ни одной вменяемой документации, где бы четко были описаны:

1. Состав регистров процессора и их обозначение;
2. Особенности архитектуры (подготовка переходов, это ваше APB и прочее);
3. Синтаксис (мнемотика) команд ассемблера. Желательно чтобы для каждой мнемотики было написано откуда появилась аббревиатура и что она означает;
4. Перечень команд (группы команд), их параметры и что они делают.

Книгу «Руководство по эффективному программированию на платформе «Эльбрус»» писали марсиане Нейман-заде и Королёв, которые прыгают с пятого на десятое.

Вот к примеру, авторы пишут:

Большинство операций имеют формат

    <мнемоника>,<канал> <аргумент>, <аргумент>, … , <результат>

Логично было бы, чтобы до этого места было объяснено, что такое «канал». Но этого не сделано. И дальше, в главе 2, ничего про каналы не сказано.

И в главе 3 ничего не сказано.

А в главе 4 появляется сразу два термина: «Канал оперативной памяти» и «Канал межпроцессорного обмена». Что же имели в виду авторы?

Только в главе 6 «Повышение производительности» появляется еще одно упоминание канала: «Вместо операции чтения, занимающей ALU, используется операция mova, занимающая отдельный канал, что освобождает в широкой команде место под арифметическую операцию». Сцук, вам не кажется, что здесь тоже не объясняется что имеется в виду под «каналом»?

Еще одно упоминание канала появляется в главе 10. А именно в описании команды «Направить логический предикат». Ведь мы же именно там будет искать описание термина «канал».

И только в главе 12 мы находим нечто, скорее всего относящееся к нашему вопросу. В объяснении что такое байпас, есть фраза: «Микропроцессор «Эльбрус» имеет 6 каналов для выполнения арифметико-логических операций, при этом каналы 0,1,2 относятся к одному кластеру, а каналы 3,4,5 относятся к другому кластеру. Байпас не может работать между кластерами, работая в каждом отдельно.»

Ну спасибо вам, хоть какой-то обрывок нужной информации написали в самой жопе документа. И так куда не ткни.

Это, мля, не документация, это издевательство над здравым смыслом.

Xintrea ★★★★★
(06.01.26 22:10:59 MSK)

Ответ на: комментарий от Xintrea 06.01.26 22:10:59 MSK

Состав регистров процессора и их обозначение;

Их очень много, разных типов и вообще всё очень запутанно.

Особенности архитектуры (подготовка переходов, это ваше APB и прочее);

Эльбрус сложная архитектура, особенно для тех кто не работал с VLIW до этого и имеют плохое представление о том как работают процессоры на микроархитектурном уровне. Объяснять будет очень долго. Лучше прочитай книжку от МЦСТ.

Синтаксис (мнемотика) команд ассемблера. Желательно чтобы для каждой мнемотики было написано откуда появилась аббревиатура и что она означает;

В открытом доступе от МЦСТ такого нет. Язык ассемблера создавался не для людей, а для рептилоидов. :)

Перечень команд (группы команд), их параметры и что они делают.

В открытом доступе от МЦСТ такого нет. Лучшее что могу посоветовать, это изучать доступные эмуляторы, желательно от МЦСТ, т.к. наш создавался по реверс-инжинирингу. Дополнительно можно посмотреть в e2kintrin.h из кросс-компилятора, там в комментариях кратко указывается что делает каждая из инструкций (там кажется только инструкции из АЛК, но не все), хватает для общего представления. Или поизучать выхлоп компилятора, если шаришь обычно этого достаточно.

Руководство по эффективному программированию на платформе «Эльбрус»

Это не мануал/спецификация на ISA, а руководство для оптимизации программ для Эльбрусов с высокоуровневых ЯП. Не надо искать там ответы на все вопросы по ISA.

что такое «канал»

В большинстве случаев речь идёт про арифметико-логические каналы (АЛК/ALC), за редкими исключениями (например mova, операции над логическими предикатами). За ответами на эти вопросы, опять же, могу посоветовать прочитать книжку от товарища Кима и Ко.

numas13 ★
(07.01.26 09:18:09 MSK)

Ссылка

Ответ на: комментарий от Xintrea 06.01.26 22:10:59 MSK

Вот к примеру, авторы пишут:

То ли дело

PSHUFB — Packed Shuffle Bytes. Instruction Operand Encoding

Op/En	Tuple Type	Operand 1	Operand 2	Operand 3	Operand 4
A	N/A	ModRM:reg (r, w)	ModRM:r/m (r)	N/A	N/A
B	N/A	ModRM:reg (w)	VEX.vvvv (r)	ModRM:r/m (r)	N/A
C	Full Mem	ModRM:reg (w)	EVEX.vvvv (r)	ModRM:r/m (r)	N/A

uin ★★★★
(10.01.26 11:04:08 MSK)

Ссылка

Ответ на: комментарий от Andrew-R 28.12.25 06:06:49 MSK

Альты замучались всратый компелятор от Эльбруса приручать. Щас наверно радуются что наконец-то оно сдохло

ckotctvo
(10.01.26 13:39:55 MSK)

Ссылка

18 марта 2026 г.

https://habr.com/ru/news/1004238/
В открытом проекте эмулятора QEMU напрямую отказали разработчикам из «МЦСТ» добавить в апстрим поддержку архитектуры «Эльбрус» (e2k) из-за санкций. В ответе представитель проекта советует сначала проконсультироваться с юристом и иметь план, чтобы работа не пропала даром.

madcore ★★★★★
(18.03.26 16:32:02 MSK)