LINUX.ORG.RU

Представлены ПК на базе Эльбрус-8С

 , ,


1

5

25 мая на проходящей в Иннополисе (республика Татарстан) конференции «Цифровая индустрия промышленной России-2017» (ЦИПР-2017) объединенный холдинг «Росэлектроника» представил первые образцы персональных компьютеров и серверов на базе микропроцессора Эльбрус-8С.

Арсений Брыкин, заместитель генерального директора АО «Росэлектроника»:

Это новое поколение отечественной вычислительной техники. Все этапы сборки осуществляются на наших производственных площадках и на предприятиях отечественных партнёров. Все это гарантирует высокий уровень информационной безопасности оборудования. Мы ожидаем, что первая опытная партия персональных компьютеров на основе нового процессора будет готова уже к концу 2 квартала 2017 года. Образцы нового оборудования мы представляем сегодня на конференции «ЦИПР» в Иннополисе.

Отмечается, что установочная партия 2- и 4-процессорных серверов будет готова к концу 2017 года. Работать сервера будут под управлением ОС «Эльбрус», которая построена на базе ядра Linux.

Остается неясным, будет ли использоваться модификация Эльбрус-8С2 с поддержкой ОЗУ стандарта DDR4 SDRAM и оптимизированной работой кэш-памяти, или это будет оригинальный чип Эльбрус-8С.

Кратко про Эльбрус-8С: 8 ядер (1.3 ГГц), 4МБ L2 кэш, 16МБ L3 кэш, 4 контроллера памяти (DDR3-1600), пиковая производительность 250 Gflops (одинарная точность). Отдельно стоит отметить, что Эльбрус-8С производится по техпроцессу 28 нм.

>>> Подробности

★★★★

Проверено: anonymous_incognito ()
Последнее исправление: anonymous_incognito (всего исправлений: 1)

Ответ на: комментарий от NiTr0

да нельзя в принципе оптимизировать неоптимизируемое

Тогда зачем это пихают как десктоп? Ладно б там квантовые компьютеры эмулировать... Вот из-за этого и претензии к ним.

NextGenenration ★★
()

Короче на откатах будут зарабатывать с этим процессором. Одна гос кампанья будет другой госкапанье продавать.

Erfahren
()
Ответ на: комментарий от danfe

А что не так? Тайвань привозит песок. Далее специально обученные люди атом за атомом на Уралвагонзаводе собирают процессор.

dmxrand
()

тэги

А почему никто не вспоминает про «Эльбрусовские» тэги? В первых «Эльбрусах» была заявлена технология, позволяющая отличать данные от исполняемого кода на аппаратном уровне. Её, что, «выпилили»? Если не «выпилили», то за такой «проц» многие бы отдали деньги несоразмерные с Intel и AMD. Просветите анонимуса, please!

anonymous
()
Ответ на: комментарий от NiTr0

да нельзя в принципе оптимизировать неоптимизируемое.

Причина не в «неоптимизируемости» задач, а в большей степени в неоптимизируемости того, что пишет рядовой лапшеписец.

потому и все 100500 портов исполнения эльбруса в среднем демонстрируют +30% по сравнению с х86 на равных частотах, а в худшем случае - до -30..50% по ipc.

Чё?

и именно поэтому голый VLIW и жив только в числодробилках-DSP. и да, итаник, поминаемый многими - не совсем голый VLIW (как минимум есть OoO планировщик), да и не совсем жив если уж на то пошло...

Влив, как некая абстрактная «ахитектура», которая не занимается мимикрией под 386 - никакого отношения к частоте, быстроте и прочей херне озвученной тут не имеет.

Итаник, х86 - это не нечто иное - это просто нахлабукча поверх влива, которая в случае с итаником не так явно причет параллельность, а в случае с х86 явно.

Ты декларируешь вещи, которые явно противоречат реальности. Начнём с того, что любой паплайн может работать только тогда, когда существует много «несвязанных друг с другом операций». В противном случае он не имеет смысла. Сколько там их захреначено в параллель мало на что влияет.

И если по какой-то причине современный штеуд быстрее( с поправкой на частоту) 386, то значит вне «числодробилок» много этих самых параллельных операций. Пусть и не в количестве 100500.

Никакие вливы и прочее к проблемам( если они есть) эльбраса отношения не имеют. Как и в любой другой системе - процессор - это борьба летенси с трупутом. И эльбрус просто выбрал трупут. Это не значит, что это ограничение какого-то влива, архитектуры, либо чего-то ещё - это выбор.

На том же фп и тяжелых операциях у штеуда никакого летенси и нет. Выкинем штеуд? А развитие его происходит только в параллель уже лет 10 как - выкинем штеуд?

Потенциально влив превосходит всё остальное по всем параметрам. Начиная с проблем х86 как циска, которые уже сотни лет упирается во фронтенд, но при этом никакие риски этому не помогут т.к. ОоО в любом случае должно быть синхронным. В это и дальше будет упираться любой риск с ОоО.

Само же железячное ОоО сливает софтварному по понятным причинам. Естественно то, что оно рантайм в некоторых случае даёт ему объективное преимущество, но на этом плюсы заканчиваются.

И начинаются субъективные плюсы. ОоО в железе даёт возможность работать всяким жабкам, пхп и прочей лапше. Софтварно его прийдётся впихивать во всё это - с чем сейчас эльбрус и мучается.

Вся лапша и мозг заточен на штеуд. Я помню как на лоре поднималось много срачей не тему того, что пацаны не отличаются if и a > b.

Именно поэтому всё это и выглядит так жалко.

Решение у пацанов из эльбруса только одно - брать в качестве таргета какой-то свой простой байткод, либо существующий риск-таргет. И далее делать из ОС вм, которая будет выступать ввиде софтварного рантайм-компилятора и оптимизатора кода.

Что-то похожее, насколько я слышал, у них уже есть. Правда оно для эмуляции х86-режима и является каким-то онлайн-транслятором.

Но в любом случае да, сделать настолько крутой анализер кода, который может выявить максимум параллельности из лапши - это мало реализуемая задача. И в конечном штеуд со своим никакими анализом выиграет за счёт частоты и летенси, но в любом случае, как я уже сказал - это не проблема влива. Это проблема именно (микро)архитектуры, либо как это там называется у эльбруса.

saifuluk
()
Ответ на: комментарий от NextGenenration

Так это черезвычайно важно. Сразу же подтянет всё то что на него завязано.

Это имеет мало смысла т.к. хоть ллвм и декларируется как некое «универсальное представление» - на самом деле это типичная 386-лапша. Всё что чуть сложнее - через адские кастыли и через жопу.

Я пилю пет-проект, который занимается тем же, чем и занимаются пацаны в эльбрусе. Только под х86. С попытками использовать и вообще иметь какое-то дело с ЛЛВМ у меня отпало сразу. Хотя мне проще - мне не нужно универсальное решение и я остановился пока на дсл"е поверх крестов.

Зачем подтягивать что-то, что будет работать ужасно?

saifuluk
()
Ответ на: комментарий от uin

КЛАСС!

Ребята, если Вы не любите вирусы - этот процессор для Вас - и незачем обсуждать его производительность - поищите альтернативу ;-)

anonymous
()

ОБРАЗОВАТЕЛЬНАЯ ПРОГРАММА ЦИПР–2017

«Киберспорт» - ТИНА КАНДЕЛАКИ
«Как сделать многомиллионный бизнес в 20 лет» - Основатель Car Price ЭДУАРД ГУРИНОВИЧ

https://cipr.ru/wp-content/uploads/2017/05/CIPR_Afisha1.pdf

Как на ТНТ попал, куда можно написать чтоб этот петушатник или прикрыли или привели в порядок?
Ведь у нас так в итоге наростет такой же слой «айтишников» как в сфере экономики выпускников гайдаровской школы экономики.

uin ★★★
()
Последнее исправление: uin (всего исправлений: 1)
Ответ на: комментарий от alexanius

В принципе на научных задачах Эльбрусы должны рвать всё и вся.

На ПРАВИЛЬНО реализованных научных задачах. Таких мало.

По поводу задачи. На моём штеуде это выполняется за 1.25 секунды. В той задачи(вернее в реализации) не вычисления, а РА к памяти(кешу). Значит эльбрус просто успешней в этом кейсе.

Мне было интересно что можно снять с х86 при правильной реализации, но меня забанили и я обиделся. Пусть и дальше из лора делают помойку и банят тех, кто действительно может ответить и решить проблему юзера.

saifuluk
()
Ответ на: комментарий от saifuluk

Причина не в «неоптимизируемости» задач, а в большей степени в неоптимизируемости того, что пишет рядовой лапшеписец.

А это можно написать по другому? За вменяемые сроки, за вменяемые деньги? Чтоб потом в этом могли разобраться остальные? Или это будет послание от инопланетян - малейшее изменение и работать перестанет?

ОоО в железе даёт возможность работать всяким жабкам, пхп и прочей лапше.

И эта лапша работает. А в плюсах ВНЕЗАПНО происходит ub и магия обретает свою волю.

И если по какой-то причине современный штеуд быстрее( с поправкой на частоту) 386,

А что, интел кто-то тормозит до 1 ГГц? А то любимая задача некоторых - утверждать что в пересчёте на частоту эльбрус лучше.

NextGenenration ★★
()
Ответ на: комментарий от saifuluk

Это имеет мало смысла т.к. хоть ллвм и декларируется как некое «универсальное представление» - на самом деле это типичная 386-лапша.

Я не выношу столь жирные утверждения. Это слишком жирно чтоб быть правдой.

NextGenenration ★★
()
Ответ на: КЛАСС! от anonymous

Ребята, если Вы не любите вирусы

вирусу просто сил не хватит. Нет жизни - нет вирусов, не так ли?

NextGenenration ★★
()
Ответ на: комментарий от NextGenenration

А это можно написать по другому? За вменяемые сроки, за вменяемые деньги? Чтоб потом в этом могли разобраться остальные? Или это будет послание от инопланетян - малейшее изменение и работать перестанет?

Не надо мне ретранслировать рядовые поверья - я их знаю и без тебя, и я их определил до тебя.

К возможностям и объективности твои требования не имеют никакого отношения. Меня вообще удивляет то, что вас так хорошо вымуштровали, что вы реально начинаете думать и беспокоится за то, что вас явно не касается и что вообще наоборот делает хуже вам - делая вас дешевле.

Всё это - проблемы не сложности. Ты можешь прийти в любой растотред и прочитать там то, что «привычки» не являются объективным критерием в пользу какого-то подхода к решению проблемы. Что-то там с этим никто не спорил, а сейчас вдруг спорит?

Да и вообще твои определния являются взаимоисключающими параграфами. Ведь поддерживаемость, доступность, способность с изменению и, конечно же, качество результата - всё это покупает за деньги и за сроки.

Тут проблема не сроков и денег, а проблема квалификации и теоретической базы. Когда у тебя мир плоский - очень сложно учитывать всякие нюансы и создавать оптимальные решения. Просто измени базу - и никакой сложности не будет.

А проблема квалификации и способностей не решаема, но что поделать. Нужно решать задачу, а не пытать дать возможность решать её всем. Все её и сейчас не решают.

И эта лапша работает. А в плюсах ВНЕЗАПНО происходит ub и магия обретает свою волю.

Зачем ты пишешь на те темы, в которых ты ничего не понимаешь? Почему ты вообще не думаешь?

Для начала типичная подмена понятий. Никакого «работает» не было и ты это сам придумал. Контекст был «качество работы».

Далее, т.к. ты не подумал и начал ретранслировать типичные поверья - ты сел в лужу. Ведь крестовая лапша ничем не отличает от жабка-лапши и не упомянул я её лишь потому, что у них как-бэ есть свой С/С++ компилятор, который они в приоритете пилят и возможно запилят.

Глупые поверья про УБ и магию я комментировать не буду.

А что, интел кто-то тормозит до 1 ГГц? А то любимая задача некоторых - утверждать что в пересчёте на частоту эльбрус лучше.

Опять же - ты мне пишешь глупость, т.к. даже не пытаешься думать. Ты глупый ретранслятор шаблонной пурги, которую ты где-то услышал.

Если бы ты подумал, то понял бы, если способен конечно. Что ОоО и пайплайн имеет смысл только тогда, тогда в коде есть независимые операции. ТТ 386 обуславливалось не его архитектурой, а слабость технологической. Замени 386 на четвертопень - ничего не поменяется.

К чему ты привёл какой-то пересчёт частоты - мне неведомо. Смысл был в том, что 386 и его наследники могут работать на частотах совершенных штеудах и работали, но показывали и показывают производительность в реальных задачах меньшую.

Из этого делается простой вывод - параллельность в рядовом коде есть и это не свойство «числодробилок».

Зачем ты мне начал писать про какую-то херню на тему «то в пересчёте на частоту эльбрус лучше». Это не моя любимая задача утверждать это - это как раз таки твоя задача - отвечать мне набором бреда.

В любом случае - мой тебе совет. Если ты слаб и при этом ещё ничего не понимаешь в тебе - лучшая твоя стратегия будет не пытаться писать мне херню, которую я в любом случае помножу на ноль, а пытаться понять то, о чём я говорю.

И уже когда поймёшь, если поймёшь - задавать вменяемые вопросы.

saifuluk
()
Ответ на: комментарий от Karapuz

всегда считал что объективная реальность не более чем чья-то мечта, спасибо за подтверждение..

Thero ★★★★★
()
Ответ на: комментарий от NiTr0

они пилят свой оптимизирующий компилятор что-бы архитектура раскрывалась.. для быдлкодера там ничего, а для профессионала уникальные возможности( но это со слов одного из этих ребят которые с этим тесно работают и разбираются в архитектуре.. в отличие от меня)

Thero ★★★★★
()
Ответ на: комментарий от NextGenenration

импортозамещение и прочие онанотехнологии же...

NiTr0 ★★★★★
()
Ответ на: комментарий от saifuluk

Ты можешь прийти в любой растотред и прочитать там то, что «привычки» не являются объективным критерием в пользу какого-то подхода к решению проблемы. Что-то там с этим никто не спорил, а сейчас вдруг спорит?

Далеко уедешь если педаль газа и тормоза поменять местами?

Ведь поддерживаемость, доступность, способность с изменению и, конечно же, качество результата - всё это покупает за деньги и за сроки.

Некоторые вещи слишком дорогие чтоб их покупать. Никода не задумывался почему софт пишут к примеру на java когда есть c++?

Никакого «работает» не было и ты это сам придумал.

Что, все пишут только на плюсах?

Ведь крестовая лапша ничем не отличает от жабка-лапши

Утечками памяти, проблемами безопасности связанными с переполнениями?

Смысл был в том, что 386 и его наследники могут работать на частотах совершенных штеудах и работали, но показывали и показывают производительность в реальных задачах меньшую.

Современный интел обгоняет современный эльбрус.

Из этого делается простой вывод - параллельность в рядовом коде есть и это не свойство «числодробилок».

Неужели числодробилки не параллелятся? Самому не смешно?

NextGenenration ★★
()
Ответ на: комментарий от NextGenenration

Неужели числодробилки не параллелятся? Самому не смешно?

Имелось в виду «не одних лишь числодробилок», вероятно.

anonymous
()
Ответ на: комментарий от saifuluk

Причина не в «неоптимизируемости» задач, а в большей степени в неоптимизируемости того, что пишет рядовой лапшеписец.

да-да, это не архитектура примитивная и дубовая - это просто весь код плохой...

Начнём с того, что любой паплайн может работать только тогда, когда существует много «несвязанных друг с другом операций». В противном случае он не имеет смысла. Сколько там их захреначено в параллель мало на что влияет.

начнем с того, что 8-9 портов исполнения с ОоО, и 23 (а вернее уже 25) порта исполнения без ОоО - это 2 больших разницы, и если первое под 100% загрузить не проблема, то второе в реальных задачах (в которых, ВНЕЗАПНО, длинные куски математических операций без ветвлений не встречаются почти никогда) хрен загрузишь.

в качестве разминки предлагаю вам прикинуть алгоритм работы с RB-деревом (поиск/вставка), такой чтобы утилизировал хотя бы треть портов исполнения эльбруса. ну чтобы не рассусоливать тут россказни о мифическом потанцевале архитектуры...

NiTr0 ★★★★★
()
Ответ на: комментарий от Thero

«пилите, Шура, они золотые» (с)

ни один мифический компилятор не сможет развернуть условно-ветвящийся код в линейный. а в реальных задачах, ВНЕЗАПНО, код - ветвящийся. будь то разбор хмл, будь то работа с деревьями/графами, будь то что-либо еще.

а «уникальные возможности» там только для числодробилок. где эльбрус по эффективности МИПС/Вт и МИПС/ядро пока еще сливается C66x DSP от TI. которым уже около 10 лет...

NiTr0 ★★★★★
()
Ответ на: комментарий от NiTr0

Кстати, а откуда там вообще берутся эти 23 порта? Там есть 6 каналов, на каждом может быть по инструкции, откуда они высрали еще 17? Я решил что это креатив по типу того, что над каждая MMX-инструкция считается за 8. 8 однобайтовых операций, и не придерешься же, хер ли.

anonymous
()
Ответ на: комментарий от NiTr0

ни один мифический компилятор не сможет развернуть условно-ветвящийся код в линейный

Поржал. Даю подсказку: предикатный режим.

alexanius ★★
()
Ответ на: комментарий от NiTr0

я в этом не шарю, перепродаю из какого-то интервью с разработчиками толи эльбруса, толи компилятора к нему..

вообще не удивлюсь если в будующих эльбрусах появится сопроцессор для нейросети который будет помогать компилятору\транслятору.. лет через пять-десять это повсюду будет походу..

Thero ★★★★★
()
Последнее исправление: Thero (всего исправлений: 1)
Ответ на: комментарий от alexanius

я уже предлагал товарисчу привести пример, как алгоритмы работы с деревьями развернуть в линейный код без ветвлений (от которых процессорам без ОоО сильно плохеет)...

NiTr0 ★★★★★
()
Ответ на: комментарий от alexanius

Поржал. Даю подсказку: предикатный режим.

Есть функция посимвольно обрабатывающая строку. В зависимости от того что это за символ она может либо вызвать другую фунцию, ничего не сделать, вызвать себя, вернуть результат. Как ты это воткнёшь в линейный код?

NextGenenration ★★
()
Ответ на: комментарий от alexanius

еще раз: линейный алгоритм работы с RB-деревьями в студию. вместо россказней о том, как космические корабли бороздят просторы Большого театра.

NiTr0 ★★★★★
()

прочитал трэд.. вспомнил анекдот:

Ребенок задумчиво подходит к отцу с вопросом:
- Папа, а что такое Виртуальность и как она отличается от Реальности?
- Ну, сынок, знаешь, как бы тебе это объяснить.... хм, ну вот, например,
сходи к маме спроси у нее, отдастся ли она грязному, вонючему бомжу,
если ей за это заплатят тысячу баксов?
Малыш озадачивает маму вопросом, которая суетится на кухне. Та немного
раздраженно:
- Передай папе, что если он так и будет продолжать лежать на диване, мне
придется это сделать, а за такие деньги даже не раз.
Получив такой содержательный ответ, малыш получает новое задание - то же
самое спросить у бабушки.
Бабуля с трудом вспоминая к чему сводится суть задачи:
- Ох, внучок,.... Аж тысяча долларов! куда ж деваться! Ну, раз деньги
большущие платют, отдамся.
Следующим в опросе оказывается дед:
- Дык, конечно, внучок! Че тут думать. Да я за тысячу все что угодно!
- Ну так, вот - продолжает отец, - ВИРТУАЛЬНО мы в доме имеем три штуки
баксов, а РЕАЛЬНО - двух проституток и одного пидараса.

чяднт?!

anonymous
()
Ответ на: комментарий от NiTr0

да-да, это не архитектура примитивная и дубовая - это просто весь код плохой...

Такой код утилизирует и 5% х86. Это ничего не меняет.

начнем с того, что 8-9 портов исполнения с ОоО, и 23 (а вернее уже 25) порта исполнения без ОоО - это 2 больших разницы, и если первое под 100% загрузить не проблема

Эксперты в треде. Для справки - х86 не может нагрузить более 4портов, но ты продолжай.

Я тебя вроде помню, портомен. Любит болтать про порты ничего в теме не понимая. Эксперта сразу видно.

Для справки - порты это лишь часть параллельности - все эти порты - это пайплайны.

Будь там хоть один порт у него параллельности может быть больше чем у 20.

Т.е. ты делаешь заявление, что 8 * x0 < 23 * x1, при этом эти иксы ты никак не определяешь. Вот я тебе о них поведал.

Никакое ОоО ни на что не влияет - оно занимается лишь сплитом потока. У эльбруса не «нету ОоО» - его нету в железяке. В конечном итоге не важно как загружаются твои порты - напрямую из декодера, либо через ОоО. Это очередной бред с твоей стороны.

то второе в реальных задачах (в которых, ВНЕЗАПНО, длинные куски математических операций без ветвлений не встречаются почти никогда) хрен загрузишь.

Ветвления - проблема тех, кто писал эту лапшу в 99% случае. Всё это либо убирается, либо обходится. Ветвления никакого отношения к портам не имеют.

в качестве разминки предлагаю вам прикинуть алгоритм работы с RB-деревом (поиск/вставка), такой чтобы утилизировал хотя бы треть портов исполнения эльбруса. ну чтобы не рассусоливать тут россказни о мифическом потанцевале архитектуры...

Во-первых поиск в дереве не утилизирует ни одного порта и в х86. Это типичная цепочка зависимых друг от друга операций. Во-вторых с чего ты мне вообще выклал своё дерево? Оно мне не упало. Да и вообще это memory bound задача.

В третьих - типичное проявление глупости и неспособности думать в рамках вменяемости. Один поиск не утилизирует, но поиски независимые, что даёт выполнять сколь угодно много поисков в параллель, собственно частично как и вставка, но с потолком.

Точно так же, как это позволяет выполнять обработку того, что ищешь в момент следующего поиска в дереве. Но такого вы даже представить себе не можете.

Поэтому для вас есть хипертрейдинг и на 25портов, если они на них равномерно распределено всё множество операций - можно повесить в 10раз больше гипетредов.

saifuluk
()
Ответ на: комментарий от anonymous

Кстати, а откуда там вообще берутся эти 23 порта? Там есть 6 каналов, на каждом может быть по инструкции, откуда они высрали еще 17? Я решил что это креатив по типу того, что над каждая MMX-инструкция считается за 8. 8 однобайтовых операций, и не придерешься же, хер ли.

Они ведут подсчёт в RISC операциях без векторных инструкций. С 64 битным вектором (MMX) на байтах будет до 109 операций.

Э-8С в циклах до 25 операций.

  • 12 в АЛК (комплексные операции, r = a [op] b [op] c)
  • 3 обработка предикатов
  • 1 передача управления
  • 4 асинхронная загрузка в РФ
  • 4 адресная арифметика
  • 1 обработка счётчика цикла

https://youtu.be/WLQU3P64Uk0?t=192

numas13
()
Ответ на: комментарий от NextGenenration

Отбросим тот факт что такой код нигде не встречается и имеет мало смысла, и рассмотрим пример:

int foo(void) {
    a = getchar();
    if( a == 'x' ) {
        bar();
    } else if( a == 'y' ) {
        // тут пусто
    } else {
        return foo();
    }
    return 0;
}

Получаем примерно следующий код:

foo:
        disp getchar -> ctpr0
        call ctpr0
        disp foo -> ctpr0
        disp bar -> ctpr1
        cmpeq r1, 'x' -> pred0
        call ctpr0 ? pred0
        call ctpr1 ? !pred0
        return ctpr3
        mov 0 -> r0 ? pred0
        ct ctpr3

Результат инструкции cmpeq r1, 'x' -> pred0 запишет булевый результат в специальный предикат. Далее инструкция call ctpr0 ? pred0 будет исполняться только если в pred0 лежит значение true. Всего таких регистров 32.

alexanius ★★
()
Ответ на: комментарий от saifuluk

Такой код утилизирует и 5% х86. Это ничего не меняет.

в любом случае - утилизация больше. а частоты, благодаря нормальной архитектуре вместо сверхширокого монстра, в разы выше.

Эксперты в треде. Для справки - х86 не может нагрузить более 4портов, но ты продолжай.

кто-то попутал порты исполнения с выходами декодеров, и продолжает невозмутимо болтать ерундой...

Ветвления - проблема тех, кто писал эту лапшу в 99% случае. Всё это либо убирается, либо обходится. Ветвления никакого отношения к портам не имеют.

ну-ну, уберите ветвления из обхода деревьев.

Во-первых поиск в дереве не утилизирует ни одного порта и в х86.

да-да, исполняется святым духом вестимо...

Во-вторых с чего ты мне вообще выклал своё дерево? Оно мне не упало. Да и вообще это memory bound задача.

да потому что работа с деревьями - это и выделение/освобождение памяти (как из кучи, так и системной), и поиск данных, и прочее, прочее, прочее... в отличие от перемножения матриц, на что только и годны DSP типа эльбруса.

В третьих - типичное проявление глупости и неспособности думать в рамках вменяемости. Один поиск не утилизирует, но поиски независимые, что даёт выполнять сколь угодно много поисков в параллель, собственно частично как и вставка, но с потолком.

да не вопрос, есть 10 значений вам, напишите алгоритм, который за один проход вставит эти 10 значений в RB-дерево. вы же специалист по алгоритмам? или - специалист по болтанию ерундой?

Поэтому для вас есть хипертрейдинг и на 25портов, если они на них равномерно распределено всё множество операций - можно повесить в 10раз больше гипетредов.

да нет там никакого «гипертрейдинга» (что бы вы под этим словом ни воображали). есть один тупой конвейер, тупо молотящий один поток MIMD команд. динамически модифицировать который (в стиле «а эти блоки сейчас будут выполнять не команды ветки А, а команды ветки Б») невозможно в принципе (вернее - программно-то возможно, самомодифицирущимся кодом, вот только кроме дополнительных тормозов и лучей поноса от «счастливцев», которым это придется отлаживать, ничего более не даст).

NiTr0 ★★★★★
()
Последнее исправление: NiTr0 (всего исправлений: 1)
Ответ на: комментарий от alexanius

Я не настолько хорош в ассемблере эльбруса чтоб понять как это будет выглядеть по тактам. Вот есть в каком-то регистре байт - текущий символ. Допустим за один такт мы запишем флаги - равен ли x, y, чему-то ещё. Наступает следующий такт. Как это можно сделать параллельно? Выполнится только одна инструкция из возможных 20+.

NextGenenration ★★
()
Ответ на: комментарий от NextGenenration

Наступает следующий такт. Как это можно сделать параллельно? Выполнится только одна инструкция из возможных 20+.

Не уверен что правильно понял вопрос, но да. Если инструкция стоит под предикатом, то она выполняется только при заданном его значении. Например у нас есть ШК:

{
    add ... ? pred0
    add ... ? ~pred0
    add ... ? ~pred0
    add ...
    add ...
    add ...
}

Здесь одна инструкция стоит под предикатом и две под антипредикатом. Ещё 3 безусловные. Это значит что за такт выполнится 4 или 5 инструкций, в зависимости от значения pred0.

alexanius ★★
()
Ответ на: комментарий от NiTr0

в любом случае - утилизация больше. а частоты, благодаря нормальной архитектуре вместо сверхширокого монстра, в разы выше.

Слив номер раз.

кто-то попутал порты исполнения с выходами декодеров, и продолжает невозмутимо болтать ерундой...

О боже, пошел прочитал ещё одну страницу мануала? Читай дальше. Окажется что не только из декодеров.

А теперь осталось понять, как в в цепочке код->декодеры->..порты может взяться трупут 8-9, когда как максимальный трупут на первой итерации равен 4? Балабол? Действительно.

ну-ну, уберите ветвления из обхода деревьев.

В начале ты кукарекал про математику, а теперь уже про деревья. Как я уже сказал - деревьями ты можешь только подтереться - мне они не интересны.

да-да, исполняется святым духом вестимо...

Типичные балабол, которые юлит.

«Не утилизирует порта» != «не исполняется на нём». Очередной слив засчитан.

да потому что работа с деревьями - это и выделение/освобождение памяти (как из кучи, так и системной), и поиск данных, и прочее, прочее, прочее... в отличие от перемножения матриц, на что только и годны DSP типа эльбруса.

С чего ты это написал? Как я уже говорил - для работы с деревьями процессор вообще не нужен. Тебе хватит и первопня с прикрученной рамой и кешом.

Осталось только понять - почему у современного штеуда архитектура не как у первопня и это это даёт профит на реальных приложениях. Значит твои деревья не отражают реальность, а значит ты ими можешь только подтерерться.

По поводу деревьев как пример ненужности эльбруса - ты уже перданул в лужу, т.к. они точно так же показывают ненужность эльбруса.

Кстати, судя по результатам пацаны выше - эльбрус в этой задаче не сливает штеуду. Выше был код, который типичное ro к l3 и эльбрус в нём не сливал.

да не вопрос, есть 10 значений вам, напишите алгоритм, который за один проход вставит эти 10 значений в RB-дерево. вы же специалист по алгоритмам? или - специалист по болтанию ерундой?

Как я уже говорил - подтирайся. А по поводу «в один проход» - ты не понимаешь всего уровня убогости той ахинее, что ты мне несёшь.

И как ты быстро слился на вставку. Очередной слив засчитан.

да нет там никакого «гипертрейдинга» (что бы вы под этим словом ни воображали). есть один тупой конвейер, тупо молотящий один поток MIMD команд. динамически модифицировать который (в стиле «а эти блоки сейчас будут выполнять не команды ветки А, а команды ветки Б») невозможно в принципе (вернее - программно-то возможно, самомодифицирущимся кодом, вот только кроме дополнительных тормозов и лучей поноса от «счастливцев», которым это придется отлаживать, ничего более не даст).

О боже, балаболка. Я где-то говорил разве, что он там есть? В очередной раз перданул в лужу и слился.

Тебе показали механизм, которым можно утилизировать то, утилизировать что твои способности тебе не позволяют.

Остальные потуги к делу не относятся.

saifuluk
()
Ответ на: комментарий от anonymous

Тогда не ной как девочка, а дай дядям делать свою работу.

unixnik ★★★★★
()
Последнее исправление: unixnik (всего исправлений: 1)
Ответ на: комментарий от saifuluk

А теперь осталось понять, как в в цепочке код->декодеры->..порты может взяться трупут 8-9, когда как максимальный трупут на первой итерации равен 4? Балабол? Действительно.

На линейном участке до 4 инструкций, в которых может быть до 6 операций.

В небольших циклах может быть больше из-за кеша микроопераций.

numas13
()
Ответ на: комментарий от numas13

На линейном участке до 4 инструкций, в которых может быть до 6 операций.

В 2юзкейсах - лдх2/лд+сд, да иф-лапшах2, что маловеряотно в живом коде увидеть.

В небольших циклах может быть больше из-за кеша микроопераций.

Если ты про лсд, то нихрена там не больше 4уопов, если ты про айкеш, то ничего больше я никогда не видел.

saifuluk
()
Ответ на: комментарий от alexanius

Предположим у нас есть:

switch (condition) {
case 0:
    foo_0();
    break;
case 1:
    foo_1();
    break;
case 2:
    foo_2();
    break;
}

Может ли Эльбрус выполнить до 3 условных переходов в одной ШК? Я знаю, что переходы кодируются в SS слоге. Я не знаю, сколько операций в нём кодируется, но для перехода достаточно всего 2 бита, то есть всего 6 бит. Я склонен предположить, что всё-таки может, следовательно может быть следующее:

{
    ct %ctpr0 ? %pred0
    ct %ctpr1 ? %pred1
    ct %ctpr2 ? %pred2
}

Следующий вопрос, можно ли начать подготовку к переходу на %cptr0, если мы его используем для перехода в текущей ШК?

{
    prepare %ctpr0
    ct %ctpr0 ? %pred0
}

Предположу, что нельзя. Выходит, можно обрабатывать до 3-х ветвлений за 2 такта:

{
    cmp %r0, 0 ? %pred0
    cmp %r1, 0 ? %pred1
    cmp %r2, 0 ? %pred2
    prepare %ctpr0
    prepare %ctpr1
    prepare %ctpr2
}
{
    ct %ctpr0 ? %pred0
    ct %ctpr1 ? %pred1
    ct %ctpr2 ? %pred2
}
{
    повторяется...
}

Но если нам надо выйти из switch, если какое-то условие выполнилось, то необходимо зарезервировать 1 регистр перехода %cptr. Выходит можно обрабатывать до 2-х условий?

numas13
()
Ответ на: комментарий от saifuluk

Если ты про лсд, то нихрена там не больше 4уопов, если ты про айкеш, то ничего больше я никогда не видел.

Глянул в microarchitecture, 4 операции на такт, даже из кеша микропераций, но он хотя бы снимает ограничение декодера на размер инструкций. xD

numas13
()
Ответ на: комментарий от Shadow

Итаниум уже улетел.

Из за чего? Помнишь? А про интел с ай386 я уже сказал — захватили рынок массовым дешевым дерьмом, а уже потом, когда конкурентов вывели — это почти без боли стало можно использовать. Но сколько миллиардов они вложили в это дело. Наверное можно было и лучше сделать.

Да и сами виноваты, что мы вынуждены тут херней страдать — пихают в свои процы всякое говно, от которого не только Столлман плюётся, но и обычные не фанатичные люди, простые потребители.

mandala ★★★★★
()
Последнее исправление: mandala (всего исправлений: 1)
Ответ на: комментарий от Karapuz

Зато были доступны по цене

Опять двадцать пять. Тот поезд ушел и не вернется. Забудьте о нем, мы тогда играли угадайку «а какого комерса/журнашлюху» сегодня в СПб завалят. Или киллеры возьмут выходной? Не до процессоров было.

А вот сейчас можно и процессорах подумать. Даже нужно, а то завтра будут амерские процы с беспроводным удаленным управлением на самом низком аппаратном уровне, дырами и закладками, и будет совсем поздно.

mandala ★★★★★
()
Ответ на: комментарий от I-Love-Microsoft

Полная гарантия от закладок будет лишь на своем производстве, не спорю.

Глупость. Люди уязвимы — всегда можно завербовать человека, любого человека. Вопрос лишь готовности тратить на это ресурсы и количества этих ресурсов. Гарантия не полная — вероятность просто существенно ниже и контролировать проще.

mandala ★★★★★
()
Ответ на: комментарий от anonymous

Зачем этот пафос?!

Как зачем? Пафос — снова бизнеса, иначе не найдешь покупателя. Даже если покупатель государство. Все пиарятся — НАСА, эпл, Эльбрусы.

mandala ★★★★★
()
Ответ на: комментарий от nebelig

Школьники завидуют и фаломорфируют от цены — даже чёткое «ненужно» выдавить из себя не могут, один визг стоит.

mandala ★★★★★
()
Ответ на: комментарий от saifuluk

В принципе на научных задачах Эльбрусы должны рвать всё и вся.

На ПРАВИЛЬНО реализованных научных задачах. Таких мало.

А почему ты при этом забываешь что на ПРАВИЛЬНО реализованных научных задачах любой современный процессор используя гетерогенные вычисления порвет этот Эльбрус с его VLIW как тузик грелку? При этом реализуется все относительно просто, библиотеки давно написаны и готовы. Просто очень часто вспоминая что некий алгоритм можно оптимизировать под VLIW и добиться существенной производительности сравнимой с современными RISC забывают что тоже самое можно сделать на копеечном APU от AMD причем гораздо проще и на порядок (если не на два) эффективнее. Если немного упростить то на AMD ценой 1400 рублей тоже ведь есть VLIW-подобный блок, только на порядок мощнее. Или я неправ?

mbivanyuk ★★★★★
()
Ответ на: комментарий от NiTr0

да-да, и MG80386EX камней не существует

да-да, и 1973 году существовал! ну-ну...

Дружище! Защищённые варианты х86 существуют для защищённых вариантов ноутбуков и ПК - армейских, промышленных. Навроде Panasonic ToughBook, только в прошлом веке. Или ВЦ атомных электростанций и т.д.. Вот их ниша.

bulch
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.