LINUX.ORG.RU

Сравнение Эльбрус-4С и Эльбрус-8С в нескольких задачах машинного зрения

 


3

5

В этой статье мы покажем, как работают технологии распознавания образов на Эльбрус-4С и на новом Эльбрус-8С: рассмотрим несколько задач машинного зрения, немного расскажем об алгоритмах их решения, приведем результаты бенчмаркинга и наконец покажем видео.

>>> Подробности

anonymous

Проверено: anonymous_incognito ()
Последнее исправление: anonymous_incognito (всего исправлений: 2)

Ответ на: комментарий от robus

Исходники выдаются обладателям компьютера на базе эльбрус. Раздавать исходники всем подрят лицензия не заставляет, но про это свидетели GPL постоянно забывают.

ox55ff ★★★★★
()
Ответ на: комментарий от Deleted

Покупателю фиолетово, что там за архитектура. Допустим, один процессор жмёт архив на гигабайт за минуту, а другой те же файлы в тот же архив жмёт за две. И так по всем типовым задачам. Какая разница почему второй процессор выполняет типовые задачи в два раза медленнее? Пользователю работать надо, а не фапать на архитектуру.

KivApple ★★★★★
()
Ответ на: комментарий от krotozer

как людям хватает наглости

Фига ты непуганый. «Как я встретил вашу маму»))

anonymous
()
Ответ на: комментарий от KivApple

Ну разумеется. Цена/качество. Но в статье обсуждается не то, за сколько времени «Эльбрус» сжимает архив, а то, что и на «Эльбрусе» можно решать научно-инженерные задачи.

Deleted
()
Ответ на: комментарий от redgremlin

Для этого нужен очень умный компилятор, которого у них нет (и ни у кого нет, иначе итаниум бы не умер)

Зато у всех есть очень умный аппаратный шедулер который делает это в обычных процах на лету, да?

веб к которым не относится от слова совсем, по причине непредсказуемости входных данных

А в интеле веб грузит все модули проца на 100% конечно. Особенно FPU не простаивает, аж вспотел.

no-such-file ★★★★★
()
Ответ на: комментарий от Deleted

Научно-инженерные задачи можно решать на любом тьюринг-полном девайсе. Так что главное таки цена-качество, а не сама возможность, которой нынче никого не удивишь. Примитивное техническое зрение даже на ардуинках делают.

KivApple ★★★★★
()
Ответ на: комментарий от Deleted

ПО практически не нуждается в патчах, так что там только пересборка их компилятором. Исходники компилятора как я понял не дают. Но он у них свой, а не допиленный gcc, здесь gpl не применимо. Что касается ядра, то тут даже ссылку на репозиторий выкладывали.

ox55ff ★★★★★
()
Ответ на: комментарий от KivApple

Научно-инженерные задачи можно решать на любом тьюринг-полном девайсе.

Конечно! Как вот я, например, на планшете на днях рассчитывал свою поделку.
Но даже самой жЫрной тролльчатине должно быть понятно, что речь в статье не о любом девайсе, а именно об «Эльбрусе».

Deleted
()
Последнее исправление: rht (всего исправлений: 1)
Ответ на: комментарий от ox55ff

Спасибо.
Исходники компилятора не так уж и нужны, кстати сказать.
Собираюсь в среднесрочной перспективе прикупить себе в частное использование. 4C oder 8C - уж как получится.

Deleted
()
Ответ на: комментарий от kto_tama

Самая «дорогая» операция для «Эльбруса» — переключение контекста.

в смысле ?
дороже чем на x86 ?
имеется ввиду - нужно сохранять бОльшее количество регистров ?

Дороже в том смысле, что эта операция напрямую зависит от частоты процессора, а она сравнительно невысокая. Тогда как код в рамках одного контекста трамбуется LCC в блоки микрокоманд одного машинного слова (до 23 у Э4С).

krotozer
()

мы покажем
рассмотрим
немного расскажем
приведем
покажем

Вы - это легион анонимусов?

Nefalius
()
Ответ на: комментарий от anonymous_incognito

да причина понятна и проста. не хватает мегагерцев. их просто тупо не хватает вообще а 23 инструкции за цикл это теоретический предел который вовсе не всегда достигается

i36_zubov
()
Ответ на: комментарий от anonymous

Выходит у него неискоренимые задержки в 25тактов, во время которых не работает шедулер, ограничивающие быстродействие)

Почему 25 тактов? 1 такт, как и везде. От того, что в этот такт может быть 25 команд, суть не меняется.

monk ★★★★★
()
Ответ на: комментарий от ox55ff

Видеокарта фундаментально гораздо более тупая железка по сравнению с CPU. Поэтому с точки зрения «давайте зафигачим отечественный компьютер занидорага» делать платформу из нескольких узко специализированных устройств, которые все выполняют свою часть, более перспективно.

anonymous
()
Ответ на: комментарий от anonymous

Имел в виду: выйдет исполнение одной команды вместо обещанных 25.

Да нет же. В один такт выполняется один пакет команд. Если в пакете 25 команд, выполнятся 25. Переключение потока внутри пакета произойти не может, так как весь пакет выполняется в один такт.

Считай, что это такая большая неделимая команда на 25 действий.

monk ★★★★★
()
Ответ на: комментарий от monk

Неа, ты не понял. Что если не удалось впихнуть 25 команд? А если бы можно было переключить контекст, то удалось бы.

anonymous
()
Ответ на: комментарий от anonymous

переключение контекста это тоже инструкции, прикинь? более того это такты, заметь не такт, а такты.

anonymous
()
Ответ на: комментарий от anonymous

Гипертрединг впилить? Подход к переключению контекста изменить (?сделать программным)?

anonymous
()
Ответ на: комментарий от anonymous

Что если не удалось впихнуть 25 команд? А если бы можно было переключить контекст, то удалось бы.

Аппаратный конвейер здесь тоже не спасёт.

К слову то, что описываешь на Эльбрусе потенциально возможно, но оба потока должны быть частью одной программы с кооперативной многозадачностью (как в Erlang). И тогда действительно в пустые операции одного потока иногда можно будет втиснуть операции другого потока. По факту они просто будут одной программой.

monk ★★★★★
()
Ответ на: комментарий от monk

К слову то, что описываешь на Эльбрусе потенциально возможно, но оба потока должны быть частью одной программы с кооперативной многозадачностью (как в Erlang). И тогда действительно в пустые операции одного потока иногда можно будет втиснуть операции другого потока. По факту они просто будут одной программой.

SMT — simultaneous multithreading. Если в потоке A произошёл кэш промах, то аппаратура переключает исполнение на поток B. Если в потоке B выполнили fdiv, то аппаратура переключает исполнение на поток C и так далее. В VLIW/Эльбрус это отлично вписывается, т.к. он часто будет простаивать в таких ситуациях.

* потоки не обязательно принадлежать одному адресному пространству.

То, что ты предлагаешь, это уже более сложная задача. Каким образом будет реализована стадия writeback/commit? Как вариант можно ждать пока все операции из одной ШК не завершаться, но это означает, что нужны доп. буферы для результатов, логика приостановки из-за structural hazard. Как будет устроен bypass?

numas13
()
Ответ на: комментарий от i36_zubov

По мне лучше бы честно рассказали, что по быстродействию процессор очень сильно отстаёт, всё равно его приобретать будут явно не из-за скорости.

anonymous_incognito ★★★★★
()
Ответ на: комментарий от anonymous_incognito

честно рассказали, что по быстродействию процессор очень сильно отстаёт

От чего? И почему это «лучше», потому что твоя картина мира тогда не рухнула бы?

no-such-file ★★★★★
()
Ответ на: комментарий от no-such-file

От чего? И почему это «лучше», потому что твоя картина мира тогда не рухнула бы?

Какая ещё картина мира, мне просто хочется представить себе какова скорость работы этого процессора. Какая цель не говорить за сколько время эти же задачи были выполнены на каком-нибудь x86-м?

anonymous_incognito ★★★★★
()
Ответ на: комментарий от anonymous_incognito

Какая ещё картина мира, мне просто хочется представить себе какова скорость работы этого процессора. Какая цель не говорить за сколько время эти же задачи были выполнены на каком-нибудь x86-м?

Эти задачи не были выполнены на x86.

monk ★★★★★
()
Ответ на: комментарий от redgremlin

При чём здесь интел и их проблемы?

Не знаю, зачем ты сравнивал с третьим пнём?

Они выглядят днищем на фоне Эльбрусов или я что-то пропустил?

Конечно. С таким бюджетом, и не обгонять копеечный Эльбрус в 10 раз - это эпик фейл. Куда истрачены миллиарды долларов?

no-such-file ★★★★★
()
Ответ на: комментарий от anonymous

Но ведь они обгоняют в десять раз.

Где? Топовый 8-ядерный Эльбрус 125Гфлопс двойной точности. У какого 8-ядерного интела есть 1Тфлопс?

no-such-file ★★★★★
()
Ответ на: комментарий от monk

это довольно паршивый аргумент. просто потому что эти задачи можно выполнить на х86 и что то мне подсказывает что vliw в дрободан сольёт древней как говно мамонта схеме томассуло. а именно она в современных х86

i36_zubov
()
Ответ на: комментарий от polozz

Мощное заявление. Как ты к нему пришёл?

ox55ff ★★★★★
()
Ответ на: комментарий от no-such-file

Куда истрачены миллиарды долларов?

На видео ядро для топовых Core i7, сливающее по производительности ноутбучным дескреткам.

На свободный видеодрайвер, куски которого всё равно в итоге закрыли. Ещё этот видеодрайвер не использует Gallium, а ещё течёт при попытке одним OpenGL контекстом рисовать в более чем одну поверхность (может эти 2 факта как-то связаны).

На сопли в процессорах для энузиастов.

На Xeon Phi, не оставляющий шансов ни Эльбрусу, ни даже райзену.

На развитие технологий (таких, как AVX, OoO и пр.).

Ну и конечно же на Intel ME.

robus ★★★★★
()
Ответ на: комментарий от ox55ff

Исходники выдаются обладателям компьютера на базе эльбрус.

Выдаются ли? Предположим, я — юрлицо куплю партию компов, адаптирую исходники ядра для мейнлайна, вытащу бэкдоры, какие найду, и отправлю патчи Линусу, то ко мне даже рашн-пативэн не приедет?

Раздавать исходники всем подрят лицензия не заставляет, но про это свидетели GPL постоянно забывают.

Раздавать всем подряд пользователям заставляет.

robus ★★★★★
()
Ответ на: комментарий от ox55ff

Ширина команды эльбруса компенсирует отсутствие avx.

Я думал низкую частоту.

robus ★★★★★
()
Ответ на: комментарий от robus

Раздавать всем подряд пользователям заставляет.

Знаешь пользователей эльбруса, которым не дали исходников? Пока кудахтанье раздаётся только от людей, видевших эльбрус лишь на картинках.

ox55ff ★★★★★
()
Ответ на: комментарий от anonymous

Сам дописал слово «никто» и радуешься. Перечитай моё сообщение ещё раз что ли.

ox55ff ★★★★★
()
Ответ на: комментарий от monk

Эти задачи не были выполнены на x86.

И написаны они были на языке, что компилировался исключительно компилятором для Эльбруса в Linux для Эльбруса? «Не верю».

Даже предполагаю, что весьма вероятно, программы писали и отлаживали на x86, просто потому что вряд ли на них удобно программировать, да и слишком мало их, чтобы понаделать машины для разработчиков в количестве.

anonymous_incognito ★★★★★
()
Ответ на: комментарий от robus

Раздавать всем подряд пользователям заставляет.

Только легальным. Кто украл - тому нет.

anonymous
()
Ответ на: комментарий от robus

Выдаются ли? Предположим, я — юрлицо куплю партию компов, адаптирую исходники ядра для мейнлайна, вытащу бэкдоры, какие найду, и отправлю патчи Линусу, то ко мне даже рашн-пативэн не приедет?

Каким боком приезд пативэна до GPL? Если ты боишься, что тебе вменять нарушение GPL будут, то зря.

anonymous
()
Ответ на: комментарий от krotozer

Товарищ поцреот, успокойтесь. Нормальным людям нужна производительность на доллар (ну или на российский тугрик) вложений. А это говно впарят вашим госструктурам втридорога и без воплей возмущения на форуме.

dzidzitop ★★
()
Ответ на: комментарий от no-such-file

Нет, но это за рамками того что обсуждалось:

redgremlin

ФФ в 2013 был без e10s, т.е. однопоточный

alt-x ★★★★★
()
Ответ на: комментарий от monk

Если в потоке есть 25 операций, который можно складировать, значит эффект будет вне зависимости от того, сколько потоков.

Тут речь про случай, когда нельзя. Соответственно, эффекта нет. Удельная производительность от количества потоков не растёт.

alt-x ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.