LINUX.ORG.RU

Представлены ПК на базе Эльбрус-8С

 , ,


1

5

25 мая на проходящей в Иннополисе (республика Татарстан) конференции «Цифровая индустрия промышленной России-2017» (ЦИПР-2017) объединенный холдинг «Росэлектроника» представил первые образцы персональных компьютеров и серверов на базе микропроцессора Эльбрус-8С.

Арсений Брыкин, заместитель генерального директора АО «Росэлектроника»:

Это новое поколение отечественной вычислительной техники. Все этапы сборки осуществляются на наших производственных площадках и на предприятиях отечественных партнёров. Все это гарантирует высокий уровень информационной безопасности оборудования. Мы ожидаем, что первая опытная партия персональных компьютеров на основе нового процессора будет готова уже к концу 2 квартала 2017 года. Образцы нового оборудования мы представляем сегодня на конференции «ЦИПР» в Иннополисе.

Отмечается, что установочная партия 2- и 4-процессорных серверов будет готова к концу 2017 года. Работать сервера будут под управлением ОС «Эльбрус», которая построена на базе ядра Linux.

Остается неясным, будет ли использоваться модификация Эльбрус-8С2 с поддержкой ОЗУ стандарта DDR4 SDRAM и оптимизированной работой кэш-памяти, или это будет оригинальный чип Эльбрус-8С.

Кратко про Эльбрус-8С: 8 ядер (1.3 ГГц), 4МБ L2 кэш, 16МБ L3 кэш, 4 контроллера памяти (DDR3-1600), пиковая производительность 250 Gflops (одинарная точность). Отдельно стоит отметить, что Эльбрус-8С производится по техпроцессу 28 нм.

>>> Подробности

★★★★

Проверено: anonymous_incognito ()
Последнее исправление: anonymous_incognito (всего исправлений: 1)

Ответ на: комментарий от NiTr0

откройте учебник что ли, просветитесь... Для тупых на пальцах: пока **все** операции из VLIW команды не выполнятся, следующая VLIW команда не будет обработана. а вот в суперскалярных - там таки следующие микрооперации могут выполняться, если они не зависят от результата еще незавершенной. но VLIW для этого слишком туп.

Так это ты туп, ты понимаешь что ту же самую работу просто в компилятор вынесли? От нее не отказались совсем, и что бы типа все писали на влив-ассемблере параллельный код, просто убрали из железа что бы преодолеть ограничения. Ты же не критикуешь штэуд за то что у него нет аппаратного h264 енкодера/декодера? Потому что да, аппаратный декодер быстрый но очень ограниченый, выходят всякие 10bit, 2k UHD и он у тебя не то что не тянет - он зеленый цвет вместо видео показывает и не обновить его никак уже. И вот тут примерно то же самое.

uin ★★★
()
Последнее исправление: uin (всего исправлений: 1)
Ответ на: комментарий от saifuluk

Как я уже сказал - деревьями ты можешь только подтереться

Деревья в том или ином виде используются достаточно часто. А ты и не знал.

NextGenenration ★★
()
Ответ на: комментарий от NiTr0

Для тупых на пальцах: пока **все** операции из VLIW команды не выполнятся, следующая VLIW команда не будет обработана. а вот в суперскалярных - там таки следующие микрооперации могут выполняться, если они не зависят от результата еще незавершенной. но VLIW для этого слишком туп.

Инструкции выполняются на каждом такте, проходя все стадии конвейера. При возникновении RAW у разработчиков архитектуры есть два варианта её решения.

  • блокировка, до момента доступности результата.
  • ничего не делать (прочитать старое значение).

Оба варианта применяются, у каждого свои плюсы и минусы. Важно понять одно, что если компилятор генерирует такой код, при возможном лучшем варианте, то проблема в компиляторе, т.к. он берёт на себя обязанности распределения операций по каналам исполнения.

ОоО с нормальным предсказанием ветвлений вполне себе поможет.

Предсказатель может быть реализован для любой control flow архитектуры, не важно OoO или VLIW.

numas13
()
Ответ на: комментарий от mandala

Да и сами виноваты, что мы вынуждены тут херней страдать — пихают в свои процы всякое говно, от которого не только Столлман плюётся, но и обычные не фанатичные люди, простые потребители.

Полтора землекопа будут выбирать процессор без intel me и ему подобного. Остальным это безразлично/нет денег на ещё один комп.

NextGenenration ★★
()
Ответ на: комментарий от mandala

Даже нужно, а то завтра будут амерские процы с беспроводным удаленным управлением на самом низком аппаратном уровне, дырами и закладками, и будет совсем поздно.

Позно пить боржоми. Они уже.

NextGenenration ★★
()
Ответ на: комментарий от numas13

Так, вот тут поподробнее. Эта не та ли задержка в 6 тактов?

Вроде 5 тактов, точно не помню, но да, она.

То есть, если я хочу сделать передачу управления, то я вынужден ждать 6 тактов, даже если условие не выполнится?

Если не выполнится то нет, ждать не нужно. Задержку нужно выдерживать только если используется результат, т.е. в данном случае %ctpr0.

Я имел виду другое, что если совершить переход на %cptr0 и в этой же ШК сделать подготовку на этот же регистр?

Нет, станки перехода не переживают вызов.

alexanius ★★
()
Ответ на: комментарий от saifuluk

А они собираются дать какие-то спеки и доступ к «телу» энтузиастам? Доступ это не значит железяку давать - хватит и удалёнки с постоянным доступом пусть и с какими-либо квотами.

С энтузиастами такая ситуация - желание есть (разговоров много), но вот пока этим заниматься некому. Вроде как если какой-то интерес есть, даже удалёнку дают в отдельных случаях, но это всё очень индивидуально и с низкой вероятностью.

alexanius ★★
()
Ответ на: комментарий от bulch

Таким, что под свою задачу используют свою архитектуру железа, которая обрастает своим набором софта.

Вылезай из семидесятых, уже есть несколько архитектур одинаковых на разном железе.

когда целые блоки программного кода, довольно большие и сложные, заменяют на встроенные в процессор общего назначения специализированные модули

В эльбрус нейросети завезли? Прям без операционной системы меня узнать сможет? Только чтоб припаял процессор к камере, не иначе.

NextGenenration ★★
()
Ответ на: комментарий от exst

собрать и запустить программу под линукс на APU AMD гораздно проще, чем собрать программу на Эльбрусе

Всё же проще. Линукс я могу скачать, а amd купить. Где я куплю эльбрус?

NextGenenration ★★
()
Ответ на: комментарий от mandala

А я Вам сообщу, процессоры это ведь не самое страшное !

А лекарства отравленные вдруг пришлют ? А того хуже, Германия бросит нам гептил и гидразин поставлять ?

А вот сейчас можно и процессорах подумать.

Думать надо шире, не в одних процессорах дело.

robot12 ★★★★★
()
Ответ на: комментарий от numas13

Инструкции выполняются на каждом такте, проходя все стадии конвейера. При возникновении RAW у разработчиков архитектуры есть два варианта её решения.

Откуда там вообще возьмётся RAW, если есть компилятор, который не должен этого делать - т.к. это не имеет смысла.

Чтение выхода должно помещаться компилятором в ту инструкцию, которая будет исполнена в момент появления в выходи этой записи.

Тем самым никакой проблемы нет вообще.

saifuluk
()
Ответ на: комментарий от bulch

Затем, что нет денег на разработку

ХаХа. Пусть заберут деньги у тех кто снимает фильмы типа «детей против волшебников».

ещё и своего отдельного простого и дешёвого процессора общего назначения

По этому давайте засунем микроконтроллер ракеты в десктоп. Тот же arm к примеру.

а гостайну как-то обеспечивать надо.

А как же текущее сертифицированное оборудование? Не счётами же пользуются.

NextGenenration ★★
()
Ответ на: комментарий от saifuluk

Я об этом и написал, читай внимательно.

Важно понять одно, что если компилятор генерирует такой код, при возможном лучшем варианте, то проблема в компиляторе, т.к. он берёт на себя обязанности распределения операций по каналам исполнения.

numas13
()
Ответ на: комментарий от alexanius

Тут просто пример довольно плохой, т.к. нет реальных действий и только вызовы. Так то if-conversion гораздо больше ветвей в гиперузел сливает.

Уже не паралелится ))

NextGenenration ★★
()
Ответ на: комментарий от saifuluk

Откуда там вообще возьмётся RAW, если есть компилятор, который не должен этого делать - т.к. это не имеет смысла.

Оттуда, что вне нашего уютного мирка гигафлопсов существует еще и дурацкая оперативная память, и если мы после каждой операций load будем ждать тупо ожидать по 50 наносекунд, пока он полностью не выполнится, то над нами будет первый Атом смеяться.

anonymous
()
Ответ на: комментарий от robus

Если в твоём коде на плюсах UB частый гость

Сюрпирз сюрпирз не в моём. Есть тут один пиарщик c++ ckotinko. Только когда произошла ub в его коде он утсроил тут панику. Ну примерно как и другие крестофилы.

NextGenenration ★★
()
Ответ на: комментарий от saifuluk

Второе - кукуруза сливает только тогда, когда есть проблема с параллельностью.

А когда паралелится то процессор сливает видеокарте. Выкидывайте процессоры, покупайте видеокарты.

NextGenenration ★★
()
Ответ на: комментарий от anonymous

Оттуда, что вне нашего уютного мирка гигафлопсов существует еще и дурацкая оперативная память, и если мы после каждой операций load будем ждать тупо ожидать по 50 наносекунд, пока он полностью не выполнится, то над нами будет первый Атом смеяться.

Это проблема дырявого ассоциативного кеша, который полностью рандомен и нахрен не нужен. Да и для этого днищекеша есть механизмы обхода - та же предвыборка.

saifuluk
()
Ответ на: комментарий от uin

Так это ты туп, ты понимаешь что ту же самую работу просто в компилятор вынесли?

Прям везде можно переписать под vliw?

NextGenenration ★★
()
Ответ на: комментарий от saifuluk

На даблах нет ничего быстрее штеуда за те же бабки

Пруфы? Tesla v100 double precision fma gflops: 7450

anonymous
()
Ответ на: комментарий от NextGenenration

Тут в другом стоит вопрос. ... Где тут применение всем 20+ инструкциям за один такт?

Изначально вопрос был как условные операторы сливаются в один линейный участок. Это я показал.

Далее. Чтобы применять 20+ вычислений за такт, нужен нормальный пример, а не этот сферический линейный участок из 3 call'ов (на самом деле даже это параллелится, просто тут нужно двух семестровый курс по компиляторам читать). Ну и да, когда работаешь со VLIW'ом, понятие IPC вообще теряет смысл - оно не говорит ровным счётом ни о чём.

И ещё вопрос: если надо выполнить всего лишь 1 инструкцию из 20+, то целиком команда будет выглядеть типа (сложить, бездельничать, бездельничать, бездельничать, бездельничать, бездельничать, бездельничать, бездельничать, бездельничать, ...)? Сколько таких «бездельничать» будет в готовом бинарнике?

Если надо выполнить 1 инструкцию, то никакой разницы между процессорами вообще нет, она исполнится за почти одинаковое время.

Подозреваю, что вопрос был всё же про среднюю плотность забивки ШК - тут нужно конкретную задачу смотреть. Очень много факторов, которые на это влияют. Подсчёт средней температуры по больнице не имеет смысла и даст ложное представление о происходящем.

Гугл думает иначе

Clang транслирует исходные коды в байт-код LLVM, затем фреймворк производит оптимизации и кодогенерацию.

И? Где тут сказано что это одно и то же? Поясню. Компилятор состоит из нескольких частей, а современные компиляторы - это вообще довольно большой набор разных программ. LLVM - это middle-end и backend, в нём производятся оптимизации и кодогенерация. Чтобы он работал ему нужно подать входные данные в определённом формате (LLVM IR). clang - это фронтенд. Он считывает программу и переводит её в заданное представление. Так сложилось что для удобства это LLVM IR.

Никто не мешает собрать llvm без clang и использовать другие фронтенды. Никто не запрещает взять clang и прикрутить его к другому компилятору, например к gcc. Например есть проект dragonEgg, который берёт фронтенды для gcc и транслирует их в llvm.

alexanius ★★
()
Ответ на: комментарий от uin

А ты тоже со своей неграмотностью/софизмом. Не ту же и не вынесли. Компилятор не способен зашедулить в реальном времени разные выполняющиеся приложения/потоки.

anonymous
()
Ответ на: комментарий от NiTr0

откройте учебник что ли, просветитесь... Для тупых на пальцах: пока **все** операции из VLIW команды не выполнятся, следующая VLIW команда не будет обработана. а вот в суперскалярных - там таки следующие микрооперации могут выполняться, если они не зависят от результата еще незавершенной. но VLIW для этого слишком туп.

Это конечно же полный бред, но вроде уже сказали об этом

alexanius ★★
()
Ответ на: комментарий от uin

штэуд за то что у него нет аппаратного h264 енкодера/декодера

Есть. Ты там совсем не просыхаешь? ))

anonymous
()
Ответ на: комментарий от saifuluk

Теперь и кеши, оказывается не нужны, что ли? Ну замечательно. Вот есть у тебя задача пройтись по связному списку и найти сумму элементов. Ну или, чтобы по-сложнее, сумму кубов косинусов элементов. Что ты собрался предвыбирать?

anonymous
()
Ответ на: комментарий от alexanius

Изначально вопрос был как условные операторы сливаются в один линейный участок. Это я показал.

Только работает это в нескольких процентах от какого-то среднестатистического кода.

Чтобы применять 20+ вычислений за такт, нужен нормальный пример

Где этот пример искать? В файловом менеджере? В архиваторе? В парсере? или в бенчмарках красивых и бесполезных?

Если надо выполнить 1 инструкцию, то никакой разницы между процессорами вообще нет, она исполнится за почти одинаковое время.

Есть же. В энергопотреблении же и частоте же.

Компилятор состоит из нескольких частей

И как clang может сливать llvm? Разве что так же как рука по грузоподёмности глазу.

NextGenenration ★★
()
Ответ на: комментарий от anonymous

У меня кор2дуо у меня нету, но если интел стал пихать ускорители (на шифрование на видео) то значит совсем все печально (этак и до битмапов/аудио не далеко).

совсем не просыхаешь?

Чет даже как то захотелось нажраться. Cколько сейчас охота крепкая стоит?

uin ★★★
()
Ответ на: комментарий от anonymous

приложения/потоки

Шедулер шедулит поток инструкций, вытаскивает откуда то там из середины независимые инструкции и то же отправляет выполняться паралельно.
Какие такие приложения он шедулит? Поясни.

uin ★★★
()
Ответ на: комментарий от NextGenenration

Меня удивляет энтузиазм пацана, который пытается тебе, невежественному балаболу, хоть что-то объяснить.

Что мы тут видим, когда балаболка обделалась в одним - она решила просто это проигнорировать и слиться на другую тему. Что же ты не ответил на то, что ллвм не является шлангом и наоборот?

Далее пошли типичные скудоумные манипуляции, а именно:

И как clang может сливать llvm? Разве что так же как рука по грузоподёмности глазу.

Как брехня к моему:

Во-вторых, никаких «супер оптимизаций» в ллвм нет. Он сливает в хлам тому же ггц вместе со шлангом.

И ссылки на то, что данный персонаж не обладает необходимыми способностями для того, чтобы распарсить это - не канают.

Ведь если мы предположим, что пациент был уверен в том, что шланг и ллвм одно и тоже, либо неделимая пара. То никак по иному интерпретировать это нельзя.

Т.е. пациент специально начинает пытаться меня ловить. Его мотивация это не читать, не понимать, а пердеть.

Далее пациент пытается сроить своё пердёж на том, что шланг и ллвм уже разное и оно сливать друг другу не может. Ещё одно доказательство того, что балаболка пытается приписывать мне заведомо противоречащую по его убогой логики вещи.

По поводу шланга. Любой человек, который обладает хоть какими-то познаниями в теме знает, что гцц - это шланг и ллвм в одном лице. И сравнивать гцц я могу не только с ллвм, но и со шлангом. Поэтому никак по иному это трактовать нельзя.

Тем более если «петя сливает васи вместе с федомом», то контекст петя, а вася это тот, кому он сливает и сливает(делает действие) он вместе с кем? С федотом. Потому что контекст петя, а у вместе он не определён - значит контекст петя.

saifuluk
()
Ответ на: комментарий от saifuluk

который пытается

1.5 попытки. +0 новых фактов. Удачно.

гцц - это шланг и ллвм в одном лице

ещё про троицу вспомни.

NextGenenration ★★
()
Ответ на: комментарий от alexanius

Кстати, в эльбрусе такой же ассоциативный кеш как и везде? Нет какого-нибудь прямого режима как кеш в виде буфера/куска памяти, либо отдельный кеш-буфер в который можно префетчить данные из памяти.

Как там обходится проблема, которую мы обсуждали выше - неоднородность памяти. Т.е. делая лоад - мы не знаем откуда он прочитается - из л1, л2, л3, рамы и т.д.

saifuluk
()
Ответ на: комментарий от uin

у штеуда давным-давно есть аппаратный декодер/энкодер. quicksync - не слыхали, не? а еще часто пихают на кристалл DSP (там, где нет GPU с OpenCL/его аналогами), а порой и FPGA.

NiTr0 ★★★★★
()
Ответ на: комментарий от NextGenenration

Только когда произошла ub в его коде он утсроил тут панику. Ну примерно как и другие крестофилы.

Да уж. Хороши «крестофилы» у нас тут на лоре. Родного языка не знают — а всё туда же :)

robus ★★★★★
()
Ответ на: комментарий от no-such-file

зачем в своё время копировали IBM 360.

Копировали как раз потому, что дико отставали (раз), IBM бы всё равно не смог удовлетворить сирос в СССР (два), ну и «патриотам» надо было что то в тарелку бросить (три)

Что мешает договорится с Intel или AMD и наладить выпуск своих, совместимых, лицензированных ядер ? Ответ - ничего, кроме пафоса. Ну и мощностей нет конечно же.

robot12 ★★★★★
()
Ответ на: комментарий от Deleted

Хохо, ездить в Россию за мылом? Сильно :)

А я думал ты поймёшь что я на советский дефицит намекаю.

NextGenenration ★★
()
Ответ на: комментарий от robot12

Ответ - ничего, кроме пафоса.

Ну, договорись. Там ещё есть куча всего, что не продают даже в железе. И на них договорись о лицензии тоже, раз можешь.

frost_ii ★★★★★
()
Ответ на: комментарий от Karapuz

Ты думаешь сейчас лучше чем в 90е?

А разве нет? Я не говорил, что сейчас рай наступил. Но и отрицать очевидное — бред.

mandala ★★★★★
()
Ответ на: комментарий от dzidzitop

VLIW нежизнеспособен

Это x86 не жизнеспособен — его поддерживает на плаву только миллиарды строк говнокода который ни когда не перепишут. И это наслаивается, наслаивается...

Бред? Да. Но меньший бред, чем твой.

mandala ★★★★★
()
Ответ на: комментарий от NextGenenration

Остальным

Слава Аллаху, еще есть в нашем отечестве люди, которые не готовы подставлять свой зад условному гуглу (и Пентагону за его спиной). Я вот только не понимаю — что у всех так горит, как будто им красного перца в залупу натёрли? Или зонд бьёт током, когда взгляд падает на конкурентов?

mandala ★★★★★
()
Последнее исправление: mandala (всего исправлений: 2)
Ответ на: комментарий от robot12

Думать надо шире, не в одних процессорах дело.

Согласен. Но фармацевтика не отменяет микроэлектронику, как и наоборот.

mandala ★★★★★
()
Ответ на: комментарий от mandala

Я вот только не понимаю — что у всех так горит

Я некоторое время пытался объяснять. Потом понял что не всем дано это понять.

NextGenenration ★★
()
Ответ на: комментарий от mandala

Согласен :)

Но тогда «отечественными» можно считать почти все крайние процессоры Intel, Sun (Oracle), Transmeta и еще неизвестно кого.

http://csef.ru/en/nauka-i-obshchestvo/306/sovetskie-korni-proczessora-intel-p... - статейка с краткой историей.

Вот только где нынче UltraSPARC, Itanum, Crusoe - именно к этим процессорам в своё время приложили руки Бабаян и Ко. И Да - Бабаян это Intel Fellow (первый в Европе).

У меня складывается впечатление, что МЦСТ просто взяли готовые наработки (ну те на которые у них есть патентные права) и отломали те на которые у них нет прав и делают из этого «процессор». Очевидно что ничего хорошего из этого, imho, не выйдет. Почему ? Для этого надо ознакамливаться с roadmap'ами того же SPARC, Power и ARM64.

robot12 ★★★★★
()
Ответ на: комментарий от NextGenenration

у меня получилось отрицательное число после обнуления старших битов. а это уже не UB никаким образом. переполнения при операции и быть не может. хотя может у вас в жабе и может, я ж не знаю.

ckotinko ☆☆☆
()
Ответ на: комментарий от NextGenenration

Ну так ведь выпустил же принципиально новую систему, способную освободить из под гнёта мелкософта же!

Лол. Ты точно под мухоморами.

Ну так ведь выпустил же принципиально новую систему, способную освободить из под гнёта мелкософта же!

Да уж, куда нам убогим, до вашего гения.

Осилить и то и другое тяжелее чем что-то одно.

Оно взаимосвязано. Давай еще предложи бросить тяжелую промышленность и поднимать только с/х — тоже самое получается, что и в твоём предложении.

mandala ★★★★★
()
Ответ на: комментарий от robot12

Вот только где нынче

ИМХО, их задавило не принципиальные ограничения, а банальная коммерческая целесообразность. Я уже тут говорил — рынок заполонили сотни миллионов дешевых x86, ПК на котором мог позволить себе даже студент. И для этих дешевых камней написали уйму кода. А дальше порочный круг — код требует этот проц, проц требует этот код. Не выгодно что-то лепить иное для массового рынка. А мейнфреймы всякие вон на других процах — и ни чё, не умирают, под них писать и переписывать коммерчески целесообразно.

mandala ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.