LINUX.ORG.RU

МЦСТ выпустила плату разработчика MBE1C-PC для Эльбрус-1С+

 , , , ,


1

5

Компания МЦСТ объявила о выпуске новой платы разработчика MBE1C-PC для новейшего микропроцессора Эльбрус-1С+. Плата выполнена в форм-факторе mini-ITX (170x170 мм) и содержит микропроцессор Эльбрус-1С+ и южный мост КПИ-2. Используется оперативная память DDR3 с ECC, которую можно подключать к двум контроллерам памяти посредством разъёмов DIMM. Так как одной из ключевых особенностей Эльбрус-1С+ является интегрированное графическое ядро, то разъёмы HDMI и LVDS обеспечивают вывод изображения на 2 независимых монитора. Для охлаждения микропроцессора предусмотрены крепления для пассивного радиатора.

Под южный мост КПИ-2 разведены следующие интерфейсы:

  • PCI-Express 2.0 x16
  • PCI-Express 2.0 x4 (для модулей miniPCI-E)
  • 8 каналов SATA 3.0 (один из них в виде разъёма mSATA)
  • 3 канала Gigabit Ethernet с поддержкой протокола IEEE1588
  • 8 каналов USB 2.0
  • 2 порта RS-232
  • HD Audio (многоканальный)
  • JTAG для отладки

К сожалению, о цене новинки никакой публичной информации не предоставлено, для интересующихся есть адрес электронной почты: sales@mcst.ru.

Изображение платы

>>> Подробности

★★★★

Проверено: tailgunner ()
Последнее исправление: cetjs2 (всего исправлений: 3)

Ответ на: комментарий от Quasar

Ну вот упомянутая уже тут Tilera (aka EZChip aka Mellanox) делает же...

gns ★★★★★
()
Последнее исправление: gns (всего исправлений: 1)
Ответ на: комментарий от anonymous

Ооооо.

Тогда эльбрус получается труъ. Во всяком случае я не вижу явных проблем для родных программ.

А по жабе на эльбрусе как я понял проблема в том, что у нее свой компилятор который требует бэкэнда который надо птсать а его нет. Вопрос: может насить компилятор байткода в си ? У мну есть предложение по тому как сделать gc, но оно многопоточное и предполагает что все таки какая то иерархия объектов будет

i36_zubov
()
Ответ на: комментарий от i36_zubov

Тогда эльбрус получается труъ.

Не могу это подтвердить, я писал им дважды, так и не ответили.

А по жабе на эльбрусе как я понял проблема в том, что у нее свой компилятор который требует бэкэнда который надо птсать а его нет.

Да. Если ты видел бенчмарки на хабре, то сравнение было не совсем корректным, т.к. на x86 работал jit компилятор, а на Эльбрусе работал интерпритатор.

Вопрос: может насить компилятор байткода в си ?

Можно. Разумеется будет оверхед, но это будет определённо лучше отсутствия jit.

anonymous
()
Ответ на: комментарий от anonymous

Про эльбрус писали много интересных вещей, в т.ч. в западной прессе и конференциях. Из запомнившегося спец блок для превентивного обхода кода который еще не выполнен и тыкания палкой в ккэш данных.это реально сложная штука.

i36_zubov
()
Ответ на: комментарий от i36_zubov

спец блок для превентивного обхода кода который еще не выполнен и тыкания палкой в ккэш данных

Не понимаю про что ты пишешь, у тебя случаем нет ссылок для ознакомления?

anonymous
()
Ответ на: комментарий от anonymous

Увы нет. Инфа была из вторых рук, на конференции по микропроцессорам в секции, посвященной борьбе с кэш промахами, приводили пример эльбруса как проца где отдельный блок рыскает и делает readahead.

i36_zubov
()
Ответ на: комментарий от anonymous

Я за этим всем слежу потому что проц свой придумываю.недавно в 2014м гадина бабаян например нагадил патентом так, что декодер пришлось переделывать. Можно былр быи обойти т.к. у него явные зависимости по номеру регистра а у меня по относительному номеру инструкции но патенты формулируются так широко что решил не рисковать

i36_zubov
()

Джентльмены, небольшой инсайд.

Новость следует читать как «сейчас готов только референс-дизайн», сами железки будут ближе к концу года. На письма ответят примерно к этому же времени - когда будет предмет разговора (пока просто физически не хватает времени). Предполагается что плату можно будет купить не только юридическим лицам. Цена пока неизвестна.

У меня всё.

alexanius ★★
()
Ответ на: комментарий от anonymous

Да нихера он не работает. Разве что из L2 сгодится добывать данные и то только для очень массовой и оптимизированной обработки данных.

Latency! Вы знаете какая она? Она нынче под двадцать циклов для L2 вместо 6 во времена пня3(L1 стоил 4 такта, все цифры по книге криса касперски).

Насколько далеко и заранее надо префетчить, как вы думаете? А то же самое но в «нормальных» программах вообще нереализуемо

i36_zubov
()
Ответ на: комментарий от i36_zubov

у меня по относительному номеру инструкции

Как в мультиклет? Маштабируемость в ширину? Скажем 16+ операций на такт? Или ты метишь в энергопотребление?

anonymous
()
Ответ на: комментарий от i36_zubov

Вы знаете какая она? Она нынче под двадцать циклов для L2

Вообще ниже.

  • Sandy Bridge and Ivy Bridge - L2 latency 11
  • Haswell and Broadwell - L2 latency 12
  • Skylake - L2 latency 14

По книге Agner Fog.

anonymous
()
Ответ на: комментарий от anonymous

Мультиклет по моему мнению наглые очкастые жулики. Я помню как челы, которые профессионально занимаются радстойкостью, у них спрашивали: как в вашем чипе обеспечивается заявленная радстойкость. Поцы даже не понимали что такое тиристорное защелкивание.

i36_zubov
()
Ответ на: комментарий от i36_zubov

отдельный блок рыскает и делает readahead.

Кажется дошло. Этот блок называется устройство обращения к массивам (УОМ). Он работает сквозь кеш, то есть не засоряет его. Отличная штука для работы с массивами. Я до сих пор точно не понимаю как он работает, сколько массивов можно вести таким образом. Не совсем понимаю как асинхронно исполняется программа для него, которая занимается предварительной загрузкой данных.

anonymous
()
Ответ на: комментарий от anonymous

Нет, я в этом плане гораздо ближе к vliw. Если быть совсем точным то у мну 64битные vliw, в которых каждая команда исполняется последовательно а при отсутсвии зависимости по данным - отдельные vliwы стартуют параллельно

i36_zubov
()
Ответ на: комментарий от anonymous

Вообще мультиклетовцы настолько явные жулики что вообще непонятно как им денег дали.

Например fpu. Они ж его синтернета скачали. Я если что сам пилил.

Общий регистровый файл. Ооо! А теперь внезапноу знаем что РФ нынче делаются double или quad data rate. А что у очкастых ботанов? Походу код на верилоге

i36_zubov
()
Ответ на: комментарий от i36_zubov

у мну 64битные vliw

Ну а подробности? Сколько исполнительных устройств? Как решил проблему разбухания РгФ? Какая расчётная тактовая частота? Аппаратная поддержка программной конвейеризации циклов? Как борешься с пустышками в конвейере при переходах?

отдельные vliwы стартуют параллельно

Не думал про EPIC? У него есть очевидные преимущества, по сравнению с классическими VLIW. Обратная совместимость, при увеличении АЛК.

anonymous
()
Ответ на: комментарий от i36_zubov

Я хз как вас анонимусов различать

Ну так классика. Нас рать. // флуд

Ну меня можно отличить, по характерному НУ, и знакам препинания, там где их не надо ставить...

anonymous
()
Ответ на: комментарий от alexanius

Спасибо. Очень похоже на правду.

gns ★★★★★
()
Ответ на: комментарий от i36_zubov

Ты не об этом?

Вот так вот стоило от темы отвернуться, как зелень успокоилась и в треде стали появляться интересные посты.

uin ★★★
()
Ответ на: комментарий от uin

Не трынди. Эльбрус интересен по железу, но всё остальное вокруг него напоминает былинный отказ.

devl547 ★★★★★
()
Ответ на: комментарий от anonymous

Я мечу в очень маленький проц. Один хрен «быстрые» АЛУ запатентованы вдоль и поперек. Поэтому мой проц делает любую операцию за 4 такта. Т.е. на 2ггц будет 500мгц реальных.

Но зато АЛУ получились очень маленькие(реально очень маленькие) и универсальные. Т.е. например блок сложения может еще операции над float, double, целыми числами, сдвиги, преобразование форматов, работу строками как побочный эффект, ибо два сдвигателя 64бита в 8 есть, алу 8бит есть, денормализованные величины мы не поддерживаем(пока что). И их в проце 4 штуки каждого типа.

вместо кэша регистровый файл на 16 кб и блок подкачки данных, который имитирует кэш из этого файла. идея была в том, что мы ассоциируем 16 8байтных регистров с номером [16N, 16N+15] с определенным адресом А путем записи адреса А в специальный адресный регистр номер N. После этой записи блок проверяет есть ли эти данные уже в РФ, если нет, команда ожидает, а если да - возвращает фактический номер регистров в РФ K. И программа уже обращается к регистрам N+16*(K-N). Пока группа регистров адресуется хоть одним адресным регистром, она не «вытесняется» из «кэша». Благодаря такому хаку стало возможным резко упростить уже декодер: т.к. «встать» мы можем только на обращении к памяти, он использует не round robin для обеспечения out-of-order execution, а множество program counterов и кэш инструкций.

Чтоб РФ работал быстро, он побит на 4 банка по 8байт в ширину и состоящих из 4 групп по 32 регистра. Чтение начинается с «дальнего» от АЛУ конца когда туда приходит адрес. Чтение SRAM вообще состоит в предзаряжании линий данный, и их «обнулению» об выбранную ячейку. т.е. result = 0xffffffff & data[n].

У меня «алгоритм» РФ такой:

in addr[6:0];
reg data1, data2, data3, data4;
wand bus1, bus2, bus3, bus4;//wire and, или "открытый коллектор"

//cycle 1
bus1 = weak 0xffffff...ffff;
if (addr[6:5] == 2b'00) 
  bus1 &= regs0[addr[4:0]];
data1 <= bus1;

//cycle 2
bus2 = data1;
if (addr[6:5] == 2b'01) 
  bus2 &= regs1[addr[4:0]];
data2 <= bus2;

//cycle 3
bus3 = data3;
if (addr[6:5] == 2b'10) 
  bus3 &= regs2[addr[4:0]];
data3 <= bus3;

//cycle 4
bus4 = data4;
if (addr[6:5] == 2b'11) 
  bus4 &= regs1[addr[4:0]];
data4 <= bus4;

//cycle 5
output = data4;

Т.е. проц получается слоупочный, гигагерцы скорее всего выдавать не будет, но 500мгц выдаст, и его на кристалле будет реально много(я прикидывал ~1кв.мм. на 90нм, 50 ядер уместится). Добирать недостающее буду за счет распаралеливания однопоточных приложений, хоть это и дико звучит, но реально можно очень много кода в десктопных приложениях выдавить в соседний проц и туда отдавать команды при условии что интерфейс к этим потокам будет аппаратный(т.е. очередь команд)

например паралелится memcpy, строковые операции над std::string, большие map, unorderedmap, вектора, со свистом паралелится Qt, cairo, pango, вся работа с сетью. GC жабы паралелится тоже легко если каждому объекту добавить высоту в иерархии и refcountы общий и от нижестоящих объектов.

в общем, вот такой план.

i36_zubov
()
Ответ на: комментарий от alexanius

Предполагается что плату можно будет купить не только юридическим лицам.

А софт? ОС, компиляторы, кросс-компиляторы, эмулятор?

tailgunner ★★★★★
()
Ответ на: комментарий от i36_zubov

мой проц делает любую операцию за 4 такта

500мгц выдаст

Т.е. 125M оп/с?

паралелится memcpy, строковые операции над std::string, большие map, unorderedmap, вектора, со свистом паралелится Qt, cairo, pango, вся работа с сетью

Оно параллелится процессором без вмешательства программиста, компилятором или еще чем-то? Как сохраняется контекст при приходе прерывания и сколько этого контекста?

tailgunner ★★★★★
()
Ответ на: комментарий от i36_zubov

Т.е. на 2ггц будет 500мгц реальных.

ALU без конвейера? Я понимаю, что это увеличит их площадь в 4+ раз, но пропускная способность вырастет в 4 раза, что даст 4-х кратное повышение IPC.

Чтоб РФ работал быстро, он побит на 4 банка по 8байт в ширину и состоящих из 4 групп по 32 регистра.

Но зачем делать работу с РгФ в 4 такта, можно ведь пустить всё параллельно?

wand result;

assign result = bank == 2'b00 ? regs0[n] : 'bz;
assign result = bank == 2'b01 ? regs1[n] : 'bz;
assign result = bank == 2'b10 ? regs2[n] : 'bz;
assign result = bank == 2'b11 ? regs3[n] : 'bz;

вместо кэша регистровый файл на 16 кб

Я так понимаю, при переключении контекста, надо его сохранять? Не будет ли накладно сохранять контекст 16 Кб + 1 Кб РгФ + остальное?

Какая длина конвейера? Есть байпас?

Если длина слишком большая, это означает много пустышек в конвейре при переходах, нужно это нивелировать, к примеру условным исполнением.

Ты не ответил про программную конвейеризацию циклов, опять таки, на VLIW это жизненно необходимо, да и стоит не так уж много, даже с автоматическими прологами и эпилогами.

Я понимаю, что всё это повышает площадь, но с этим растёт производительность однопотока, что означает меньшее кол-во контекстов для выполнения той же работы.

И последний, самый главный вопрос, опять таки VLIW, что с компилятором?

anonymous
()
Ответ на: комментарий от anonymous

Ты не ответил про программную конвейеризацию циклов, опять таки, на VLIW это жизненно необходимо, да и стоит не так уж много, даже с автоматическими прологами и эпилогами.

Я тут подумал, какая к черту ПКЦ, если АЛК без конвейера...

anonymous
()
Ответ на: комментарий от anonymous

параллельно то зачем. растет площадь ячеек причем конски, падает скорость, сложность схемы и т.д. QDR-SRAM двухпортовая может 4ггц выдавать если ее на участки нарезать например, а «обычный» 2W-4R РФ 700-800 мгц. т.е. зачем? визгу много - шерсти мало

i36_zubov
()
Ответ на: комментарий от i36_zubov

а «обычный» 2W-4R РФ 700-800 мгц. т.е. зачем?

Посмотри как сделано в том же Э-4С (65 нм). РгФ на 10 совмещённых портов на частоте 1600 МГц.

anonymous
()
Ответ на: комментарий от i36_zubov

на 2ггц будет 500мгц реальных

Сейчас же как раз проблема в тепловыделении при высоких частотах. Совсем не круто выходит, а сложность не важна, в 14нм много всего влезает.

anonymous
()

Омские линуксоиды одобряют...

Не больше 10 ватт процессор кушает. Ня!

linuxmaster ★★★★
()
Ответ на: комментарий от anonymous

Как делаются рф я и так знаю. Мне хватает qdr 1w2r в том виде в котором он у мну есть. Один хрен это не самое узкое место.

i36_zubov
()
Ответ на: комментарий от alexanius

Предполагается что плату можно будет купить не только юридическим лицам.

Отлично! Значит быть моему подкроватному серверу на эльбрусе :)

p.s. tailgunner, MuZHiK-2, может это в ОП добавить?

Deleted
()
Ответ на: комментарий от Deleted

Отлично! Значит быть моему подкроватному серверу на эльбрусе :)

И для поддержания отечественной электроники продать квартиру,взять кредит и купить пару отечественных жестких дисков ВНД-М2.05 :-(
Оказывается жесткие диски у нас выпускаются - емкость 50 мгб , цена гуглиться , перед гуглением провериться у психиатра ,принять успокоительное .Не я понимаю что военная техника ,но блин 5,25 отечественные жесткие на 25 мгб проходили сертификацию в варианте к артиллерийскому комплексу (в кунге урала на базе эвм искра если не подводит память ) и так дорого не стоили (

maximnik0 ★★
()
Ответ на: комментарий от Deleted

Радует, что рассматривают физлиц как потенциальных покупателей. Думаю, стоит дождаться реализации их планов.

MuZHiK-2 ★★★★
() автор топика
Ответ на: комментарий от frost_ii

Интересно, лор так скатился или просто даже не выкатывался?

anonymous
()
Ответ на: комментарий от frost_ii

Об этом ? http://fishki.net/2027791-v-seti-rasprostranjaetsja-rzhachnaja-rzhaka-pro-imp...

«а сделать подобное изделие современные монстры типа Intel или Apple скорее всего не смогут. Опыт и наработки потеряны в погоне за массовыми деньгами домохозяек и веганов.

Ruslan Karmanov»

Ок, лан.

tailgunner ★★★★★
()
Ответ на: комментарий от frost_ii

Пусть себе это покупает кармашек, равно и эти какахи МЦСТ, страна дллжна знать своих дебилов!!!

anonymous
()
Ответ на: комментарий от i36_zubov

Один хрен это не самое узкое место.

Но если ты не в состоянии загрузить 4 АЛК работой, то следующее:

Т.е. на 2ггц будет 500мгц реальных.

неверно! Примерно на 2 ГГц будет от 50 до 100 MIPS, если не хуже.

anonymous
()
Ответ на: комментарий от tailgunner

На сколько я понимаю - будет как минимум выложен дистрибутив. Скорей всего с нативным компилятором. Касательно кросового - не знаю, эмулятор - сильно сомневаюсь. В принципе даже тупо выложенный дистрибутив - уже хорошо, хотя интересно какую версию выложат.

alexanius ★★
()
Ответ на: комментарий от maximnik0

но блин 5,25 отечественные жесткие на 25 мгб проходили сертификацию в варианте к артиллерийскому комплексу (в кунге урала на базе эвм искра если не подводит память ) и так дорого не стоили (

Ну так они делались поди на ещё не разваленных отечественных заводах, процесс был налажен, ломать не строить.

У нас в Рязани завод САМ делал «Искру 1030М». Программно полностью IBM XT-совместимая машина, но аппаратно имелись отличия, шина собственного конструктива. (Тот же САМ выпускал «Партнёр 01.01» - 8-разрядную машину, развитие «Радио-86РК», но с существенными улучшениями.)

А потом всё накрылось. И теперь надо начинать с нуля в условиях жесточайшей конкуренции...

hobbit ★★★★★
()
Ответ на: комментарий от frost_ii

Об этом ? http://fishki.net/2027791-v-seti-rasprostranjaetsja-rzhachnaja->rzhaka-pro...

Ну если скорость не важна ,то похожее изделие 10 лет назад выпускала фирма ИБМ -правда не жесткий,там лента с спецсплавом,чтоб выдерживать перегрузки и нагрев.Изделие проходило сертификацию у военных и для работы в черных ящиках самолетов,правда там емкость было что то до гига .Были и жесткие диски размером с 5 центовую монету,емкость до 180 мгб,правда выдерживали перегрузки до всего лиш 250 G .Но опять же ,да дорого стоили,но если тебе приспичило покупать не кто не запрещал, и опять же не такая стоимость :-(

maximnik0 ★★
()
Последнее исправление: maximnik0 (всего исправлений: 1)
Ответ на: комментарий от maximnik0

В чёрных ящиках стоят ссд. Эта маня потребитель контента фишек.нет с соответствующим уровнем развития и знаний.

anonymous
()
Ответ на: комментарий от anonymous

В чёрных ящиках стоят ссд.

Когда флэш появилась и когда разрешил MAK ее ставить в черные ящики? .А до этого и у нас ,и за границей использовали ленту и проволоку ,в некоторых случаях специальную фольгированную бумагу .

maximnik0 ★★
()
Ответ на: комментарий от maximnik0

Я знаю, но это всё дела давно минувших дней.

anonymous
()
Ответ на: комментарий от maximnik0

Не катит. После Курска ленточные устройства были запрещены, требования были ужесточены. Мы ведь про спецносители говорим, да?

frost_ii ★★★★★
()

И набежала либерасня =))

anonymous
()
Ответ на: комментарий от frost_ii

Не катит. После Курска ленточные устройства были запрещены, требования были ужесточены. Мы ведь про спецносители говорим, да?


Судя по https://www.drive2.ru/b/2615302/ , требования к карману были резко ужесточены, судя по внешнему виду собирали электронику в радио кружке «Юный электрик» Ж-( ,по комментариям изделие стоило 1-1,5 миллиона рублей .

maximnik0 ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.