Ответ на: комментарий от NiTr0 26.05.17 18:33:14 MSK

да нельзя в принципе оптимизировать неоптимизируемое

Тогда зачем это пихают как десктоп? Ладно б там квантовые компьютеры эмулировать... Вот из-за этого и претензии к ним.

NextGenenration ★★
(26.05.17 18:51:49 MSK)

Короче на откатах будут зарабатывать с этим процессором. Одна гос кампанья будет другой госкапанье продавать.

Erfahren
(26.05.17 19:07:59 MSK)

Ссылка

Ответ на: комментарий от danfe 25.05.17 23:01:02 MSK

А что не так? Тайвань привозит песок. Далее специально обученные люди атом за атомом на Уралвагонзаводе собирают процессор.

~~dmxrand~~ ★
(26.05.17 19:43:19 MSK)

тэги

А почему никто не вспоминает про «Эльбрусовские» тэги? В первых «Эльбрусах» была заявлена технология, позволяющая отличать данные от исполняемого кода на аппаратном уровне. Её, что, «выпилили»? Если не «выпилили», то за такой «проц» многие бы отдали деньги несоразмерные с Intel и AMD. Просветите анонимуса, please!

anonymous
(26.05.17 19:48:32 MSK)

Ответ на: комментарий от NiTr0 26.05.17 18:33:14 MSK

да нельзя в принципе оптимизировать неоптимизируемое.

Причина не в «неоптимизируемости» задач, а в большей степени в неоптимизируемости того, что пишет рядовой лапшеписец.

потому и все 100500 портов исполнения эльбруса в среднем демонстрируют +30% по сравнению с х86 на равных частотах, а в худшем случае - до -30..50% по ipc.

Чё?

и именно поэтому голый VLIW и жив только в числодробилках-DSP. и да, итаник, поминаемый многими - не совсем голый VLIW (как минимум есть OoO планировщик), да и не совсем жив если уж на то пошло...

Влив, как некая абстрактная «ахитектура», которая не занимается мимикрией под 386 - никакого отношения к частоте, быстроте и прочей херне озвученной тут не имеет.

Итаник, х86 - это не нечто иное - это просто нахлабукча поверх влива, которая в случае с итаником не так явно причет параллельность, а в случае с х86 явно.

Ты декларируешь вещи, которые явно противоречат реальности. Начнём с того, что любой паплайн может работать только тогда, когда существует много «несвязанных друг с другом операций». В противном случае он не имеет смысла. Сколько там их захреначено в параллель мало на что влияет.

И если по какой-то причине современный штеуд быстрее( с поправкой на частоту) 386, то значит вне «числодробилок» много этих самых параллельных операций. Пусть и не в количестве 100500.

Никакие вливы и прочее к проблемам( если они есть) эльбраса отношения не имеют. Как и в любой другой системе - процессор - это борьба летенси с трупутом. И эльбрус просто выбрал трупут. Это не значит, что это ограничение какого-то влива, архитектуры, либо чего-то ещё - это выбор.

На том же фп и тяжелых операциях у штеуда никакого летенси и нет. Выкинем штеуд? А развитие его происходит только в параллель уже лет 10 как - выкинем штеуд?

Потенциально влив превосходит всё остальное по всем параметрам. Начиная с проблем х86 как циска, которые уже сотни лет упирается во фронтенд, но при этом никакие риски этому не помогут т.к. ОоО в любом случае должно быть синхронным. В это и дальше будет упираться любой риск с ОоО.

Само же железячное ОоО сливает софтварному по понятным причинам. Естественно то, что оно рантайм в некоторых случае даёт ему объективное преимущество, но на этом плюсы заканчиваются.

И начинаются субъективные плюсы. ОоО в железе даёт возможность работать всяким жабкам, пхп и прочей лапше. Софтварно его прийдётся впихивать во всё это - с чем сейчас эльбрус и мучается.

Вся лапша и мозг заточен на штеуд. Я помню как на лоре поднималось много срачей не тему того, что пацаны не отличаются if и a > b.

Именно поэтому всё это и выглядит так жалко.

Решение у пацанов из эльбруса только одно - брать в качестве таргета какой-то свой простой байткод, либо существующий риск-таргет. И далее делать из ОС вм, которая будет выступать ввиде софтварного рантайм-компилятора и оптимизатора кода.

Что-то похожее, насколько я слышал, у них уже есть. Правда оно для эмуляции х86-режима и является каким-то онлайн-транслятором.

Но в любом случае да, сделать настолько крутой анализер кода, который может выявить максимум параллельности из лапши - это мало реализуемая задача. И в конечном штеуд со своим никакими анализом выиграет за счёт частоты и летенси, но в любом случае, как я уже сказал - это не проблема влива. Это проблема именно (микро)архитектуры, либо как это там называется у эльбруса.

~~saifuluk~~
(26.05.17 19:50:03 MSK)

Ответ на: тэги от anonymous 26.05.17 19:48:32 MSK

Все это там есть, ничего не выпилили.

uin ★★★
(26.05.17 19:56:18 MSK)

Ответ на: комментарий от NextGenenration 26.05.17 18:41:15 MSK

Так это черезвычайно важно. Сразу же подтянет всё то что на него завязано.

Это имеет мало смысла т.к. хоть ллвм и декларируется как некое «универсальное представление» - на самом деле это типичная 386-лапша. Всё что чуть сложнее - через адские кастыли и через жопу.

Я пилю пет-проект, который занимается тем же, чем и занимаются пацаны в эльбрусе. Только под х86. С попытками использовать и вообще иметь какое-то дело с ЛЛВМ у меня отпало сразу. Хотя мне проще - мне не нужно универсальное решение и я остановился пока на дсл"е поверх крестов.

Зачем подтягивать что-то, что будет работать ужасно?

~~saifuluk~~
(26.05.17 20:05:15 MSK)

Ответ на: комментарий от uin 26.05.17 19:56:18 MSK

КЛАСС!

Ребята, если Вы не любите вирусы - этот процессор для Вас - и незачем обсуждать его производительность - поищите альтернативу ;-)

anonymous
(26.05.17 20:07:15 MSK)

ОБРАЗОВАТЕЛЬНАЯ ПРОГРАММА ЦИПР–2017

«Киберспорт» - ТИНА КАНДЕЛАКИ
«Как сделать многомиллионный бизнес в 20 лет» - Основатель Car Price ЭДУАРД ГУРИНОВИЧ

https://cipr.ru/wp-content/uploads/2017/05/CIPR_Afisha1.pdf

Как на ТНТ попал, куда можно написать чтоб этот петушатник или прикрыли или привели в порядок?
Ведь у нас так в итоге наростет такой же слой «айтишников» как в сфере экономики выпускников гайдаровской школы экономики.

uin ★★★
(26.05.17 20:43:32 MSK)
Последнее исправление: uin 26.05.17 20:44:12 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от alexanius 26.05.17 11:39:16 MSK

В принципе на научных задачах Эльбрусы должны рвать всё и вся.

На ПРАВИЛЬНО реализованных научных задачах. Таких мало.

По поводу задачи. На моём штеуде это выполняется за 1.25 секунды. В той задачи(вернее в реализации) не вычисления, а РА к памяти(кешу). Значит эльбрус просто успешней в этом кейсе.

Мне было интересно что можно снять с х86 при правильной реализации, но меня забанили и я обиделся. Пусть и дальше из лора делают помойку и банят тех, кто действительно может ответить и решить проблему юзера.

~~saifuluk~~
(26.05.17 21:07:12 MSK)

Ответ на: комментарий от saifuluk 26.05.17 19:50:03 MSK

Причина не в «неоптимизируемости» задач, а в большей степени в неоптимизируемости того, что пишет рядовой лапшеписец.

А это можно написать по другому? За вменяемые сроки, за вменяемые деньги? Чтоб потом в этом могли разобраться остальные? Или это будет послание от инопланетян - малейшее изменение и работать перестанет?

ОоО в железе даёт возможность работать всяким жабкам, пхп и прочей лапше.

И эта лапша работает. А в плюсах ВНЕЗАПНО происходит ub и магия обретает свою волю.

И если по какой-то причине современный штеуд быстрее( с поправкой на частоту) 386,

А что, интел кто-то тормозит до 1 ГГц? А то любимая задача некоторых - утверждать что в пересчёте на частоту эльбрус лучше.

NextGenenration ★★
(26.05.17 21:17:25 MSK)

Ответ на: комментарий от saifuluk 26.05.17 20:05:15 MSK

Это имеет мало смысла т.к. хоть ллвм и декларируется как некое «универсальное представление» - на самом деле это типичная 386-лапша.

Я не выношу столь жирные утверждения. Это слишком жирно чтоб быть правдой.

NextGenenration ★★
(26.05.17 21:18:55 MSK)

Ссылка

Ответ на: КЛАСС! от anonymous 26.05.17 20:07:15 MSK

Ребята, если Вы не любите вирусы

вирусу просто сил не хватит. Нет жизни - нет вирусов, не так ли?

NextGenenration ★★
(26.05.17 21:20:09 MSK)

Ссылка

Ответ на: комментарий от Thero 26.05.17 17:56:28 MSK

да где там он уделывает, в мечтах амдшников

Karapuz ★★★★★
(26.05.17 21:40:16 MSK)

Ответ на: комментарий от NextGenenration 26.05.17 21:17:25 MSK

А это можно написать по другому? За вменяемые сроки, за вменяемые деньги? Чтоб потом в этом могли разобраться остальные? Или это будет послание от инопланетян - малейшее изменение и работать перестанет?

Не надо мне ретранслировать рядовые поверья - я их знаю и без тебя, и я их определил до тебя.

К возможностям и объективности твои требования не имеют никакого отношения. Меня вообще удивляет то, что вас так хорошо вымуштровали, что вы реально начинаете думать и беспокоится за то, что вас явно не касается и что вообще наоборот делает хуже вам - делая вас дешевле.

Всё это - проблемы не сложности. Ты можешь прийти в любой растотред и прочитать там то, что «привычки» не являются объективным критерием в пользу какого-то подхода к решению проблемы. Что-то там с этим никто не спорил, а сейчас вдруг спорит?

Да и вообще твои определния являются взаимоисключающими параграфами. Ведь поддерживаемость, доступность, способность с изменению и, конечно же, качество результата - всё это покупает за деньги и за сроки.

Тут проблема не сроков и денег, а проблема квалификации и теоретической базы. Когда у тебя мир плоский - очень сложно учитывать всякие нюансы и создавать оптимальные решения. Просто измени базу - и никакой сложности не будет.

А проблема квалификации и способностей не решаема, но что поделать. Нужно решать задачу, а не пытать дать возможность решать её всем. Все её и сейчас не решают.

И эта лапша работает. А в плюсах ВНЕЗАПНО происходит ub и магия обретает свою волю.

Зачем ты пишешь на те темы, в которых ты ничего не понимаешь? Почему ты вообще не думаешь?

Для начала типичная подмена понятий. Никакого «работает» не было и ты это сам придумал. Контекст был «качество работы».

Далее, т.к. ты не подумал и начал ретранслировать типичные поверья - ты сел в лужу. Ведь крестовая лапша ничем не отличает от жабка-лапши и не упомянул я её лишь потому, что у них как-бэ есть свой С/С++ компилятор, который они в приоритете пилят и возможно запилят.

Глупые поверья про УБ и магию я комментировать не буду.

А что, интел кто-то тормозит до 1 ГГц? А то любимая задача некоторых - утверждать что в пересчёте на частоту эльбрус лучше.

Опять же - ты мне пишешь глупость, т.к. даже не пытаешься думать. Ты глупый ретранслятор шаблонной пурги, которую ты где-то услышал.

Если бы ты подумал, то понял бы, если способен конечно. Что ОоО и пайплайн имеет смысл только тогда, тогда в коде есть независимые операции. ТТ 386 обуславливалось не его архитектурой, а слабость технологической. Замени 386 на четвертопень - ничего не поменяется.

К чему ты привёл какой-то пересчёт частоты - мне неведомо. Смысл был в том, что 386 и его наследники могут работать на частотах совершенных штеудах и работали, но показывали и показывают производительность в реальных задачах меньшую.

Из этого делается простой вывод - параллельность в рядовом коде есть и это не свойство «числодробилок».

Зачем ты мне начал писать про какую-то херню на тему «то в пересчёте на частоту эльбрус лучше». Это не моя любимая задача утверждать это - это как раз таки твоя задача - отвечать мне набором бреда.

В любом случае - мой тебе совет. Если ты слаб и при этом ещё ничего не понимаешь в тебе - лучшая твоя стратегия будет не пытаться писать мне херню, которую я в любом случае помножу на ноль, а пытаться понять то, о чём я говорю.

И уже когда поймёшь, если поймёшь - задавать вменяемые вопросы.

~~saifuluk~~
(26.05.17 21:48:23 MSK)

Ответ на: комментарий от Karapuz 26.05.17 21:40:16 MSK

всегда считал что объективная реальность не более чем чья-то мечта, спасибо за подтверждение..

Thero ★★★★★
(26.05.17 22:15:46 MSK)

Ссылка

Ответ на: комментарий от NiTr0 26.05.17 18:34:36 MSK

они пилят свой оптимизирующий компилятор что-бы архитектура раскрывалась.. для быдлкодера там ничего, а для профессионала уникальные возможности( но это со слов одного из этих ребят которые с этим тесно работают и разбираются в архитектуре.. в отличие от меня)

Thero ★★★★★
(26.05.17 22:20:50 MSK)

Ответ на: комментарий от NextGenenration 26.05.17 18:51:49 MSK

импортозамещение и прочие онанотехнологии же...

NiTr0 ★★★★★
(26.05.17 22:25:21 MSK)

Ссылка

Ответ на: комментарий от saifuluk 26.05.17 21:48:23 MSK

Ты можешь прийти в любой растотред и прочитать там то, что «привычки» не являются объективным критерием в пользу какого-то подхода к решению проблемы. Что-то там с этим никто не спорил, а сейчас вдруг спорит?

Далеко уедешь если педаль газа и тормоза поменять местами?

Ведь поддерживаемость, доступность, способность с изменению и, конечно же, качество результата - всё это покупает за деньги и за сроки.

Некоторые вещи слишком дорогие чтоб их покупать. Никода не задумывался почему софт пишут к примеру на java когда есть c++?

Никакого «работает» не было и ты это сам придумал.

Что, все пишут только на плюсах?

Ведь крестовая лапша ничем не отличает от жабка-лапши

Утечками памяти, проблемами безопасности связанными с переполнениями?

Смысл был в том, что 386 и его наследники могут работать на частотах совершенных штеудах и работали, но показывали и показывают производительность в реальных задачах меньшую.

Современный интел обгоняет современный эльбрус.

Из этого делается простой вывод - параллельность в рядовом коде есть и это не свойство «числодробилок».

Неужели числодробилки не параллелятся? Самому не смешно?

NextGenenration ★★
(26.05.17 22:31:49 MSK)

Ответ на: комментарий от NextGenenration 26.05.17 22:31:49 MSK

Неужели числодробилки не параллелятся? Самому не смешно?

Имелось в виду «не одних лишь числодробилок», вероятно.

anonymous
(26.05.17 22:34:12 MSK)

Ссылка

Ответ на: комментарий от saifuluk 26.05.17 19:50:03 MSK

Причина не в «неоптимизируемости» задач, а в большей степени в неоптимизируемости того, что пишет рядовой лапшеписец.

да-да, это не архитектура примитивная и дубовая - это просто весь код плохой...

Начнём с того, что любой паплайн может работать только тогда, когда существует много «несвязанных друг с другом операций». В противном случае он не имеет смысла. Сколько там их захреначено в параллель мало на что влияет.

начнем с того, что 8-9 портов исполнения с ОоО, и 23 (а вернее уже 25) порта исполнения без ОоО - это 2 больших разницы, и если первое под 100% загрузить не проблема, то второе в реальных задачах (в которых, ВНЕЗАПНО, длинные куски математических операций без ветвлений не встречаются почти никогда) хрен загрузишь.

в качестве разминки предлагаю вам прикинуть алгоритм работы с RB-деревом (поиск/вставка), такой чтобы утилизировал хотя бы треть портов исполнения эльбруса. ну чтобы не рассусоливать тут россказни о мифическом потанцевале архитектуры...

NiTr0 ★★★★★
(26.05.17 22:39:56 MSK)

Ответ на: комментарий от Thero 26.05.17 22:20:50 MSK

«пилите, Шура, они золотые» (с)

ни один мифический компилятор не сможет развернуть условно-ветвящийся код в линейный. а в реальных задачах, ВНЕЗАПНО, код - ветвящийся. будь то разбор хмл, будь то работа с деревьями/графами, будь то что-либо еще.

а «уникальные возможности» там только для числодробилок. где эльбрус по эффективности МИПС/Вт и МИПС/ядро пока еще сливается C66x DSP от TI. которым уже около 10 лет...

NiTr0 ★★★★★
(26.05.17 22:44:35 MSK)

Ответ на: комментарий от NiTr0 26.05.17 22:39:56 MSK

Кстати, а откуда там вообще берутся эти 23 порта? Там есть 6 каналов, на каждом может быть по инструкции, откуда они высрали еще 17? Я решил что это креатив по типу того, что над каждая MMX-инструкция считается за 8. 8 однобайтовых операций, и не придерешься же, хер ли.

anonymous
(26.05.17 22:47:25 MSK)

Ответ на: комментарий от NiTr0 26.05.17 22:44:35 MSK

ни один мифический компилятор не сможет развернуть условно-ветвящийся код в линейный

Поржал. Даю подсказку: предикатный режим.

alexanius ★★
(26.05.17 22:48:04 MSK)

Ответ на: комментарий от NiTr0 26.05.17 22:44:35 MSK

я в этом не шарю, перепродаю из какого-то интервью с разработчиками толи эльбруса, толи компилятора к нему..

вообще не удивлюсь если в будующих эльбрусах появится сопроцессор для нейросети который будет помогать компилятору\транслятору.. лет через пять-десять это повсюду будет походу..

Thero ★★★★★
(26.05.17 22:53:18 MSK)
Последнее исправление: Thero 26.05.17 22:56:44 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от alexanius 26.05.17 22:48:04 MSK

я уже предлагал товарисчу привести пример, как алгоритмы работы с деревьями развернуть в линейный код без ветвлений (от которых процессорам без ОоО сильно плохеет)...

NiTr0 ★★★★★
(26.05.17 22:56:40 MSK)

Ответ на: комментарий от NiTr0 26.05.17 22:56:40 MSK

Утверждение что ветвления нельзя слить в линейный участок вызывающе неверное, на что я и обратил внимание.

alexanius ★★
(26.05.17 23:01:16 MSK)

Ответ на: комментарий от alexanius 26.05.17 22:48:04 MSK

Поржал. Даю подсказку: предикатный режим.

Есть функция посимвольно обрабатывающая строку. В зависимости от того что это за символ она может либо вызвать другую фунцию, ничего не сделать, вызвать себя, вернуть результат. Как ты это воткнёшь в линейный код?

NextGenenration ★★
(26.05.17 23:01:38 MSK)

Ответ на: комментарий от alexanius 26.05.17 23:01:16 MSK

еще раз: линейный алгоритм работы с RB-деревьями в студию. вместо россказней о том, как космические корабли бороздят просторы Большого театра.

NiTr0 ★★★★★
(26.05.17 23:16:39 MSK)

Ссылка

прочитал трэд.. вспомнил анекдот:

Ребенок задумчиво подходит к отцу с вопросом:
- Папа, а что такое Виртуальность и как она отличается от Реальности?
- Ну, сынок, знаешь, как бы тебе это объяснить.... хм, ну вот, например,
сходи к маме спроси у нее, отдастся ли она грязному, вонючему бомжу,
если ей за это заплатят тысячу баксов?
Малыш озадачивает маму вопросом, которая суетится на кухне. Та немного
раздраженно:
- Передай папе, что если он так и будет продолжать лежать на диване, мне
придется это сделать, а за такие деньги даже не раз.
Получив такой содержательный ответ, малыш получает новое задание - то же
самое спросить у бабушки.
Бабуля с трудом вспоминая к чему сводится суть задачи:
- Ох, внучок,.... Аж тысяча долларов! куда ж деваться! Ну, раз деньги
большущие платют, отдамся.
Следующим в опросе оказывается дед:
- Дык, конечно, внучок! Че тут думать. Да я за тысячу все что угодно!
- Ну так, вот - продолжает отец, - ВИРТУАЛЬНО мы в доме имеем три штуки
баксов, а РЕАЛЬНО - двух проституток и одного пидараса.

чяднт?!

anonymous
(26.05.17 23:22:25 MSK)

Ссылка

Ответ на: комментарий от NiTr0 26.05.17 22:39:56 MSK

да-да, это не архитектура примитивная и дубовая - это просто весь код плохой...

Такой код утилизирует и 5% х86. Это ничего не меняет.

начнем с того, что 8-9 портов исполнения с ОоО, и 23 (а вернее уже 25) порта исполнения без ОоО - это 2 больших разницы, и если первое под 100% загрузить не проблема

Эксперты в треде. Для справки - х86 не может нагрузить более 4портов, но ты продолжай.

Я тебя вроде помню, портомен. Любит болтать про порты ничего в теме не понимая. Эксперта сразу видно.

Для справки - порты это лишь часть параллельности - все эти порты - это пайплайны.

Будь там хоть один порт у него параллельности может быть больше чем у 20.

Т.е. ты делаешь заявление, что 8 * x0 < 23 * x1, при этом эти иксы ты никак не определяешь. Вот я тебе о них поведал.

Никакое ОоО ни на что не влияет - оно занимается лишь сплитом потока. У эльбруса не «нету ОоО» - его нету в железяке. В конечном итоге не важно как загружаются твои порты - напрямую из декодера, либо через ОоО. Это очередной бред с твоей стороны.

то второе в реальных задачах (в которых, ВНЕЗАПНО, длинные куски математических операций без ветвлений не встречаются почти никогда) хрен загрузишь.

Ветвления - проблема тех, кто писал эту лапшу в 99% случае. Всё это либо убирается, либо обходится. Ветвления никакого отношения к портам не имеют.

в качестве разминки предлагаю вам прикинуть алгоритм работы с RB-деревом (поиск/вставка), такой чтобы утилизировал хотя бы треть портов исполнения эльбруса. ну чтобы не рассусоливать тут россказни о мифическом потанцевале архитектуры...

Во-первых поиск в дереве не утилизирует ни одного порта и в х86. Это типичная цепочка зависимых друг от друга операций. Во-вторых с чего ты мне вообще выклал своё дерево? Оно мне не упало. Да и вообще это memory bound задача.

В третьих - типичное проявление глупости и неспособности думать в рамках вменяемости. Один поиск не утилизирует, но поиски независимые, что даёт выполнять сколь угодно много поисков в параллель, собственно частично как и вставка, но с потолком.

Точно так же, как это позволяет выполнять обработку того, что ищешь в момент следующего поиска в дереве. Но такого вы даже представить себе не можете.

Поэтому для вас есть хипертрейдинг и на 25портов, если они на них равномерно распределено всё множество операций - можно повесить в 10раз больше гипетредов.

~~saifuluk~~
(26.05.17 23:35:19 MSK)

Ответ на: комментарий от anonymous 26.05.17 22:47:25 MSK

Кстати, а откуда там вообще берутся эти 23 порта? Там есть 6 каналов, на каждом может быть по инструкции, откуда они высрали еще 17? Я решил что это креатив по типу того, что над каждая MMX-инструкция считается за 8. 8 однобайтовых операций, и не придерешься же, хер ли.

Они ведут подсчёт в RISC операциях без векторных инструкций. С 64 битным вектором (MMX) на байтах будет до 109 операций.

Э-8С в циклах до 25 операций.

12 в АЛК (комплексные операции, r = a [op] b [op] c)
3 обработка предикатов
1 передача управления
4 асинхронная загрузка в РФ
4 адресная арифметика
1 обработка счётчика цикла

https://youtu.be/WLQU3P64Uk0?t=192

numas13 ★
(26.05.17 23:38:21 MSK)

Ссылка

Ответ на: комментарий от NextGenenration 26.05.17 23:01:38 MSK

Отбросим тот факт что такой код нигде не встречается и имеет мало смысла, и рассмотрим пример:

int foo(void) {
    a = getchar();
    if( a == 'x' ) {
        bar();
    } else if( a == 'y' ) {
        // тут пусто
    } else {
        return foo();
    }
    return 0;
}

Получаем примерно следующий код:

foo:
        disp getchar -> ctpr0
        call ctpr0
        disp foo -> ctpr0
        disp bar -> ctpr1
        cmpeq r1, 'x' -> pred0
        call ctpr0 ? pred0
        call ctpr1 ? !pred0
        return ctpr3
        mov 0 -> r0 ? pred0
        ct ctpr3

Результат инструкции cmpeq r1, 'x' -> pred0 запишет булевый результат в специальный предикат. Далее инструкция call ctpr0 ? pred0 будет исполняться только если в pred0 лежит значение true. Всего таких регистров 32.

alexanius ★★
(26.05.17 23:46:26 MSK)

Ответ на: комментарий от saifuluk 26.05.17 23:35:19 MSK

Такой код утилизирует и 5% х86. Это ничего не меняет.

в любом случае - утилизация больше. а частоты, благодаря нормальной архитектуре вместо сверхширокого монстра, в разы выше.

Эксперты в треде. Для справки - х86 не может нагрузить более 4портов, но ты продолжай.

кто-то попутал порты исполнения с выходами декодеров, и продолжает невозмутимо болтать ерундой...

Ветвления - проблема тех, кто писал эту лапшу в 99% случае. Всё это либо убирается, либо обходится. Ветвления никакого отношения к портам не имеют.

ну-ну, уберите ветвления из обхода деревьев.

Во-первых поиск в дереве не утилизирует ни одного порта и в х86.

да-да, исполняется святым духом вестимо...

Во-вторых с чего ты мне вообще выклал своё дерево? Оно мне не упало. Да и вообще это memory bound задача.

да потому что работа с деревьями - это и выделение/освобождение памяти (как из кучи, так и системной), и поиск данных, и прочее, прочее, прочее... в отличие от перемножения матриц, на что только и годны DSP типа эльбруса.

В третьих - типичное проявление глупости и неспособности думать в рамках вменяемости. Один поиск не утилизирует, но поиски независимые, что даёт выполнять сколь угодно много поисков в параллель, собственно частично как и вставка, но с потолком.

да не вопрос, есть 10 значений вам, напишите алгоритм, который за один проход вставит эти 10 значений в RB-дерево. вы же специалист по алгоритмам? или - специалист по болтанию ерундой?

Поэтому для вас есть хипертрейдинг и на 25портов, если они на них равномерно распределено всё множество операций - можно повесить в 10раз больше гипетредов.

да нет там никакого «гипертрейдинга» (что бы вы под этим словом ни воображали). есть один тупой конвейер, тупо молотящий один поток MIMD команд. динамически модифицировать который (в стиле «а эти блоки сейчас будут выполнять не команды ветки А, а команды ветки Б») невозможно в принципе (вернее - программно-то возможно, самомодифицирущимся кодом, вот только кроме дополнительных тормозов и лучей поноса от «счастливцев», которым это придется отлаживать, ничего более не даст).

NiTr0 ★★★★★
(26.05.17 23:55:04 MSK)
Последнее исправление: NiTr0 26.05.17 23:55:53 MSK (всего исправлений: 1)

Ответ на: комментарий от alexanius 26.05.17 23:46:26 MSK

Я не настолько хорош в ассемблере эльбруса чтоб понять как это будет выглядеть по тактам. Вот есть в каком-то регистре байт - текущий символ. Допустим за один такт мы запишем флаги - равен ли x, y, чему-то ещё. Наступает следующий такт. Как это можно сделать параллельно? Выполнится только одна инструкция из возможных 20+.

NextGenenration ★★
(27.05.17 00:05:07 MSK)

Ответ на: комментарий от NextGenenration 27.05.17 00:05:07 MSK

Наступает следующий такт. Как это можно сделать параллельно? Выполнится только одна инструкция из возможных 20+.

Не уверен что правильно понял вопрос, но да. Если инструкция стоит под предикатом, то она выполняется только при заданном его значении. Например у нас есть ШК:

{
    add ... ? pred0
    add ... ? ~pred0
    add ... ? ~pred0
    add ...
    add ...
    add ...
}

Здесь одна инструкция стоит под предикатом и две под антипредикатом. Ещё 3 безусловные. Это значит что за такт выполнится 4 или 5 инструкций, в зависимости от значения pred0.

alexanius ★★
(27.05.17 00:14:44 MSK)

Ответ на: комментарий от NiTr0 26.05.17 23:55:04 MSK

в любом случае - утилизация больше. а частоты, благодаря нормальной архитектуре вместо сверхширокого монстра, в разы выше.

Слив номер раз.

кто-то попутал порты исполнения с выходами декодеров, и продолжает невозмутимо болтать ерундой...

О боже, пошел прочитал ещё одну страницу мануала? Читай дальше. Окажется что не только из декодеров.

А теперь осталось понять, как в в цепочке код->декодеры->..порты может взяться трупут 8-9, когда как максимальный трупут на первой итерации равен 4? Балабол? Действительно.

ну-ну, уберите ветвления из обхода деревьев.

В начале ты кукарекал про математику, а теперь уже про деревья. Как я уже сказал - деревьями ты можешь только подтереться - мне они не интересны.

да-да, исполняется святым духом вестимо...

Типичные балабол, которые юлит.

«Не утилизирует порта» != «не исполняется на нём». Очередной слив засчитан.

да потому что работа с деревьями - это и выделение/освобождение памяти (как из кучи, так и системной), и поиск данных, и прочее, прочее, прочее... в отличие от перемножения матриц, на что только и годны DSP типа эльбруса.

С чего ты это написал? Как я уже говорил - для работы с деревьями процессор вообще не нужен. Тебе хватит и первопня с прикрученной рамой и кешом.

Осталось только понять - почему у современного штеуда архитектура не как у первопня и это это даёт профит на реальных приложениях. Значит твои деревья не отражают реальность, а значит ты ими можешь только подтерерться.

По поводу деревьев как пример ненужности эльбруса - ты уже перданул в лужу, т.к. они точно так же показывают ненужность эльбруса.

Кстати, судя по результатам пацаны выше - эльбрус в этой задаче не сливает штеуду. Выше был код, который типичное ro к l3 и эльбрус в нём не сливал.

да не вопрос, есть 10 значений вам, напишите алгоритм, который за один проход вставит эти 10 значений в RB-дерево. вы же специалист по алгоритмам? или - специалист по болтанию ерундой?

Как я уже говорил - подтирайся. А по поводу «в один проход» - ты не понимаешь всего уровня убогости той ахинее, что ты мне несёшь.

И как ты быстро слился на вставку. Очередной слив засчитан.

да нет там никакого «гипертрейдинга» (что бы вы под этим словом ни воображали). есть один тупой конвейер, тупо молотящий один поток MIMD команд. динамически модифицировать который (в стиле «а эти блоки сейчас будут выполнять не команды ветки А, а команды ветки Б») невозможно в принципе (вернее - программно-то возможно, самомодифицирущимся кодом, вот только кроме дополнительных тормозов и лучей поноса от «счастливцев», которым это придется отлаживать, ничего более не даст).

О боже, балаболка. Я где-то говорил разве, что он там есть? В очередной раз перданул в лужу и слился.

Тебе показали механизм, которым можно утилизировать то, утилизировать что твои способности тебе не позволяют.

Остальные потуги к делу не относятся.

~~saifuluk~~
(27.05.17 00:27:51 MSK)

Ответ на: комментарий от anonymous 26.05.17 17:41:37 MSK

Тогда не ной как девочка, а дай дядям делать свою работу.

unixnik ★★★★★
(27.05.17 00:33:33 MSK)
Последнее исправление: unixnik 27.05.17 00:35:05 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от saifuluk 27.05.17 00:27:51 MSK

А теперь осталось понять, как в в цепочке код->декодеры->..порты может взяться трупут 8-9, когда как максимальный трупут на первой итерации равен 4? Балабол? Действительно.

На линейном участке до 4 инструкций, в которых может быть до 6 операций.

В небольших циклах может быть больше из-за кеша микроопераций.

numas13 ★
(27.05.17 00:38:24 MSK)

Ответ на: комментарий от numas13 27.05.17 00:38:24 MSK

На линейном участке до 4 инструкций, в которых может быть до 6 операций.

В 2юзкейсах - лдх2/лд+сд, да иф-лапшах2, что маловеряотно в живом коде увидеть.

В небольших циклах может быть больше из-за кеша микроопераций.

Если ты про лсд, то нихрена там не больше 4уопов, если ты про айкеш, то ничего больше я никогда не видел.

~~saifuluk~~
(27.05.17 00:50:21 MSK)

Ответ на: комментарий от alexanius 27.05.17 00:14:44 MSK

Предположим у нас есть:

switch (condition) {
case 0:
    foo_0();
    break;
case 1:
    foo_1();
    break;
case 2:
    foo_2();
    break;
}

Может ли Эльбрус выполнить до 3 условных переходов в одной ШК? Я знаю, что переходы кодируются в SS слоге. Я не знаю, сколько операций в нём кодируется, но для перехода достаточно всего 2 бита, то есть всего 6 бит. Я склонен предположить, что всё-таки может, следовательно может быть следующее:

{
    ct %ctpr0 ? %pred0
    ct %ctpr1 ? %pred1
    ct %ctpr2 ? %pred2
}

Следующий вопрос, можно ли начать подготовку к переходу на %cptr0, если мы его используем для перехода в текущей ШК?

{
    prepare %ctpr0
    ct %ctpr0 ? %pred0
}

Предположу, что нельзя. Выходит, можно обрабатывать до 3-х ветвлений за 2 такта:

{
    cmp %r0, 0 ? %pred0
    cmp %r1, 0 ? %pred1
    cmp %r2, 0 ? %pred2
    prepare %ctpr0
    prepare %ctpr1
    prepare %ctpr2
}
{
    ct %ctpr0 ? %pred0
    ct %ctpr1 ? %pred1
    ct %ctpr2 ? %pred2
}
{
    повторяется...
}

Но если нам надо выйти из switch, если какое-то условие выполнилось, то необходимо зарезервировать 1 регистр перехода %cptr. Выходит можно обрабатывать до 2-х условий?

numas13 ★
(27.05.17 00:57:43 MSK)

Ответ на: комментарий от saifuluk 27.05.17 00:50:21 MSK

Если ты про лсд, то нихрена там не больше 4уопов, если ты про айкеш, то ничего больше я никогда не видел.

Глянул в microarchitecture, 4 операции на такт, даже из кеша микропераций, но он хотя бы снимает ограничение декодера на размер инструкций. xD

numas13 ★
(27.05.17 01:14:08 MSK)

Ссылка

Ответ на: комментарий от Shadow 26.05.17 10:31:45 MSK

Итаниум уже улетел.

Из за чего? Помнишь? А про интел с ай386 я уже сказал — захватили рынок массовым дешевым дерьмом, а уже потом, когда конкурентов вывели — это почти без боли стало можно использовать. Но сколько миллиардов они вложили в это дело. Наверное можно было и лучше сделать.

Да и сами виноваты, что мы вынуждены тут херней страдать — пихают в свои процы всякое говно, от которого не только Столлман плюётся, но и обычные не фанатичные люди, простые потребители.

mandala ★★★★★
(27.05.17 01:58:39 MSK)
Последнее исправление: mandala 27.05.17 02:00:41 MSK (всего исправлений: 1)

Ответ на: комментарий от Karapuz 26.05.17 13:00:13 MSK

Зато были доступны по цене

Опять двадцать пять. Тот поезд ушел и не вернется. Забудьте о нем, мы тогда играли угадайку «а какого комерса/журнашлюху» сегодня в СПб завалят. Или киллеры возьмут выходной? Не до процессоров было.

А вот сейчас можно и процессорах подумать. Даже нужно, а то завтра будут амерские процы с беспроводным удаленным управлением на самом низком аппаратном уровне, дырами и закладками, и будет совсем поздно.

mandala ★★★★★
(27.05.17 02:15:28 MSK)

Ответ на: комментарий от I-Love-Microsoft 26.05.17 14:39:49 MSK

Полная гарантия от закладок будет лишь на своем производстве, не спорю.

Глупость. Люди уязвимы — всегда можно завербовать человека, любого человека. Вопрос лишь готовности тратить на это ресурсы и количества этих ресурсов. Гарантия не полная — вероятность просто существенно ниже и контролировать проще.

mandala ★★★★★
(27.05.17 02:33:27 MSK)

Ссылка

Ответ на: комментарий от anonymous 26.05.17 15:11:42 MSK

Зачем этот пафос?!

Как зачем? Пафос — снова бизнеса, иначе не найдешь покупателя. Даже если покупатель государство. Все пиарятся — НАСА, эпл, Эльбрусы.

mandala ★★★★★
(27.05.17 02:35:35 MSK)

Ссылка

Ответ на: комментарий от nebelig 26.05.17 18:36:05 MSK

Школьники завидуют и фаломорфируют от цены — даже чёткое «ненужно» выдавить из себя не могут, один визг стоит.

mandala ★★★★★
(27.05.17 03:00:34 MSK)

Ссылка

Ответ на: комментарий от saifuluk 26.05.17 21:07:12 MSK

В принципе на научных задачах Эльбрусы должны рвать всё и вся.
На ПРАВИЛЬНО реализованных научных задачах. Таких мало.

А почему ты при этом забываешь что на ПРАВИЛЬНО реализованных научных задачах любой современный процессор используя гетерогенные вычисления порвет этот Эльбрус с его VLIW как тузик грелку? При этом реализуется все относительно просто, библиотеки давно написаны и готовы. Просто очень часто вспоминая что некий алгоритм можно оптимизировать под VLIW и добиться существенной производительности сравнимой с современными RISC забывают что тоже самое можно сделать на копеечном APU от AMD причем гораздо проще и на порядок (если не на два) эффективнее. Если немного упростить то на AMD ценой 1400 рублей тоже ведь есть VLIW-подобный блок, только на порядок мощнее. Или я неправ?

mbivanyuk ★★★★★
(27.05.17 04:41:01 MSK)

Ответ на: комментарий от MuZHiK-2 25.05.17 23:12:39 MSK

Ога, человек из ФБР.

anonymous
(27.05.17 05:34:37 MSK)

Ссылка

Ответ на: комментарий от NiTr0 26.05.17 18:23:10 MSK

да-да, и MG80386EX камней не существует

да-да, и 1973 году существовал! ну-ну...

Дружище! Защищённые варианты х86 существуют для защищённых вариантов ноутбуков и ПК - армейских, промышленных. Навроде Panasonic ToughBook, только в прошлом веке. Или ВЦ атомных электростанций и т.д.. Вот их ниша.

bulch ★
(27.05.17 07:22:21 MSK)

тэги

КЛАСС!

Похожие темы