LINUX.ORG.RU
ФорумTalks

[для Ъ][Форт-процессоры] SEAforth® 40C18. 40 ядер за несколько Ватт...


0

0

По теме http://www.linux.org.ru/jump-message.jsp?msgid=4582882&cid=4594682

Подумалось тут, что некоторым нашим Ъ будет интересно про такую железку узнать:

http://www.intellasys.net/index.php?option=com_content&task=view&id=60&Itemid=75

Есть некоторая расходимость данных, заявленных в русском анонсе и на офсайте, так что указываю данные с офсайта, а в фигурных скобках - с анонсов.

- 40 ядер
- Каждое ядро работает полностью асинхронно {на 700МГц}
- У каждого ядра одна операция за такт
- 9мВт {150мВт} на ядро. {6Вт на всю систему под пиковой нагрузкой}
- суммарно 26млрд оп/с
- в режиме же ожидания каждое ядро потребляет <5мкВт {5,4мкВт}.
- система связи и синхронизации между ядрами обладает нулевым временем ожидания
- Три девятибитных ЦАП
- Три 18-битных АЦП
- У каждого ядра свои ОЗУ и ПЗУ (объём на сайте не указан, нужно читать спеки)
- К процессору поставляется VentureForth®, который исполняется на нём нативно.

Собственно, спеки: http://www.intellasys.net/index.php?option=com_content&task=view&id=24&Itemid=43

Процессоры, вроде, по 40 EUR продаются, но с одного процессора толку мало, а вот кит, в котором идёт мать с поддержкой Midi/Audio, RS232 и USB - $499...

26 млрд. оп/с за $500 - ИМХО, неплохо. Никому не нужно? :)

★★★★★

Чет я не нашел по ссылке какая у него архитектура. Иными словами что на нем будет работать из операционнок?

mobile
()

MISCи ожили?

А форт - жесть для раскурки (32 команды на всё про всё - эт вам не бубль гум)...

Оно, я ничего не перепутал?

Интересно, будет та же история, что и CISC -> RISC? Intelы будут стороить новый уровень трансляции команд? :)

helios ★★★★★
()

Интересная штучка, но возникают вопросы.

1. Почему проц такой дешевый?

2. Почему мать такая дорогая? Малая серия? но ведь и у процов не особо большая, имхо.

3. Что на этом уже идет, что можно скомпилировать с минимальными затратами и что не пойдет никогда?

gvozdila
()
Ответ на: комментарий от mobile

Дык, Форт-процессор же. Ни одна из современных ОС ни под чем нестандартным работать не будет.

Он для тех применений, когда требуется высокая вычислительная мощь при малом энергопотреблении и пофиг на наличие стандартного софта, поскольку всё равно всё писать придётся с нуля.

Зато 26 млрд. оп/с за несколько Ватт :)

Получается, где-то на 2-3 порядка эффективнее того же Intel'а.

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от gvozdila

>1. Почему проц такой дешевый?

Наверное, потому что простой. Достаточно эффективные Форт-процессоры народ сегодня на ПЛИСах сегодня в домашних условиях делает. Хотя, конечно, оно во многом Just-for-fun.

2. Почему мать такая дорогая? Малая серия?


Угу. Под те же ARM'ы киты тоже такого порядка стоят, хотя процессоры - дешёвые.

но ведь и у процов не особо большая, имхо.


На самом деле цена в 40EUR за процессор на офсайте нигде не обозначена. Видел её только в одном русскоязычном анонсе. Вполне может быть, что процессор и дороже. На офсайте цена только на кит приводится. И не понятно, входит ли в состав кита VentureForth или его нужно отдельно покупать.

3. Что на этом уже идет, что можно скомпилировать с минимальными затратами и что не пойдет никогда?


Похоже, кроме VentureForth под него из средств разработки больше ничего нет. Так что, автоматически, ничего из мировых наработок под него нет. Получается очень узкая ниша, но, похоже, разработчикам шире и не нужно :) Скорее всего, процессор делался под какие-то свои узкие задачи, но, раз уж сделали, то решили, почему бы и не попродавать.

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

>Дык, Форт-процессор же. Ни одна из современных ОС ни под чем нестандартным работать не будет.

Научить gcc компилять в форт, нет? ;)

redgremlin ★★★★★
()
Ответ на: комментарий от antony986

>можно накатать какой нить гипервизор и пустить лялих, нет?

Ну, наверное, эмулятор какого-нить x86 слепить можно. Но тогда в чём смысл, проще взять готовый x86 или ARM :)

...

Думаю, смысл имеет этот девайс подключать к обычному компу как внешнее устройство. Четыре сотни таких плат в стойку - и за несколько киловатт мощности получим 1TIPS оп/c :) Хотя без плавучки (я так понимаю, её там нет) применимость такого решения, конечно, тоже ограничена.

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от redgremlin

>Научить gcc компилять в форт, нет? ;)

Боюсь, сперва нужно научить GCC компилить задачи на 40 асинхронных ядер :)

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от helios

>а вы вообще представляете какую-нибудь реальную задачу, которую можно распаралеллить на 40 ядер? :)

Всякие FFT в частности и обработку разного медиа вообще, матричные операции, рендеринг и т.п. :)

...

Вообще же, порылся, как и следовало ожидать, сабж официально позиционируется для встраиваемых систем.

...

Особенно интересно выглядит экстремально низкое энергопотребление ядер в режиме ожидания. Т.е. при правильной разработке, этот процессор можно пихать куда угодно в роли сопроцессора. При простое ничего почти не жрёт, как понадобилась мощность - так жрёт столько, сколько надо :)

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

Ога китайцы выпцстят клон intel i70 который будет в 10 раз производительнее i7, а внутрях окажется напейхано пучек сабжевых процыов и redflaglinux

wfrr ★★☆
()

Похоже на рождение первого млекопитающего в эпоху динозавров.

Attila ★★
()
Ответ на: комментарий от linux4ever

Энергопотребление прежде всего, ещё масштабируемостью, всё таки там чип, а не килограммовая текстолитовая печка. Сабжевые процы при сопоставимой производительности по сравнению с теслами почти ничего не жрут.
Всё это конечно только в том случае, если спеки соответствуют действительности и если эти девайсы реально можно будет купить. А то даже omap45* и тот так долго идёт до потребителя, что сердце наполняется унынием.

ixrws ★★★
()
Ответ на: комментарий от redgremlin

Чиста теоретически много чего можно, но на практике даже нормальной глобальной оптимизации в компиляторах до сих пор нет, есть только её зачатки. Куда уж там до разделения последовательности на параллельные блоки.

ixrws ★★★
()
Ответ на: комментарий от mobile

Далеко не всегда нужно использовать ПО, часто его надо сначала писать, а потом использовать. Причин может быть много: и уникальность задачи? и насквозь проприетарность уже созданных решений.
А применения крон выше уже писал. И если сабжевое железо соответсвует заявленным характеристикам, то желающие его купить найдутся, очень даже. Хотя конечно было бы неплохо видеть для него поддержку более человеческих технологий(C, opencl), а не инопланетных, но это при желании вопрос решаемый.

ixrws ★★★
()
Ответ на: комментарий от linux4ever

>А какое у него преимущество над видеоадаптерами?

Сравни потребляемую мощность :)

Кроме того, в отличии от GPU, тут каждое ядро - независимый полноценный процессор.

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от dimon555

>чего про форт почитать дельного лучше присоветуй?

ИМХО, лучшая книга по идеологии - это Thinking Forth Лео Броуди. В своё время она мне очень здорово вправила мозги и я множество идей и подходов оттуда в других языках использую.

А что касается практики - тут сколько разных Фортов, столько и практик.

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от helios

Но всё-таки мне кажется, что если есть возможность сделать больше работы на уровне железа за равное время, то не стоит выносить это в софт. Вот в ранних армах не было деления, а потом добавили, когда появилась возможность аппаратно разделить за время, не превышающее такт. Иначе для сохранения производительности придётся частоту до небес гнать. А распараллелить пока не каждую задачу удаётся. Вот если сделают компилятор, который будет выдавать код, оптимизированный под 100500 ядер...

Yareg ★★★
()
Ответ на: комментарий от KRoN73

Ты на адресное пространство лучше посмотри сего шедевра))
- контроллер контроллером , последние штаны за софт и средства отладки сдерут. А камушки типа дешовые, да.

elipse ★★★
()
Ответ на: комментарий от elipse

А разве у других подобных чипов ситуация не такова? У меня большого опыта в сфере встройки нет, но все чипы дробилки, которые попадались(dsp от ti, marvel итд) стоят сами копейки, а софт для них и дебаг борды зашкаливают. Это обычная практика. Было бы удивительно и глазавыпучительно, если бы и софт, и камни и тд стояли как навоз. Да, нынешняя ситуация не нормальна, но она везде такая. Даже медиапроцессоры в omap и те требуют для удобной разработки снять последний штаны, хотя поидее это масс продукт, чай не давинчи.

ixrws ★★★
()
Ответ на: комментарий от question4

SEAforth 40C18 Data Sheet

... Each core is an 18-bit computer that is a Forth stack machine. Its instruction set consists of
32 basic opcodes. It uses a data stack for parameters and a return stack
for control flow.
...
Each core has 64 words of local RAM and 64 words of local
ROM.

...


Each C18 core executes code only from its own local memory and ports.
Although RAM is mapped from $000 through $07F and ROM from $080
through $0FF, the arrays are only 64 physical 18-bit words long and are
thus each mapped twice (address bit 6 ($040) is not actually decoded).
....
The C18 Core
SEAforth 40C18 Data Sheet (Preliminary)
For example, address $008 decodes to the same RAM word as $048.
Additionally, the incrementer is only seven bits wide; thus the next
logical ROM word after $0FF is $080, which decodes to the same memory
word as $0C0.
....


крайне специфическая штука ))

elipse ★★★
()
Ответ на: комментарий от elipse

аки кодло PIC16 (раннего разлива) на одном кристалле

elipse ★★★
()
Ответ на: комментарий от Yareg

> Но всё-таки мне кажется, что если есть возможность сделать больше работы на уровне железа за равное время, то не стоит выносить это в софт.

А вы думаете, что количество команд согнали до 32х потому, что проеграм так удобнее? :) Нет, это сделано, чтобы как можно больше команд передать за такт шины (считали года 2 назад, получалось, что штук 5-6 - вполне реально). А дальше, на стороне процессора VLIW...

А распараллелить пока не каждую задачу удаётся.

Вы как-то слишком политкорректно выражаетесь :) Них не получается распаралелить программу, написанную для нормального последовательного режима выполнения. А писать для паралельных вычислений - тот ещё гемор (ибо мозг привык мыслить последовательно).

ps бесит маркетинговый приём: чем болшьше ядер - тем мощнее машинка. Ну вот у меня есть лаптоп с коре-дуо 2ГГц и дескроп селер 2.(6) ГГц. Угадайте кто кого рвёт на тестах? А ведь произведены с range в 4-5 лет...

helios ★★★★★
()
Ответ на: комментарий от question4

> А можно ли использовать эти процессоры в видеоадаптерах? :)

ну не совсем как видеоадаптер, но для расчета сцены имхо вполне можно.

isden ★★★★★
()
Ответ на: комментарий от KRoN73

Virtex5 выдаёт >80 Gflops на 550Мгц, что на порядок эффективнее этого процессора, и это при том, что вышло оно на 3 года раньше

frame ★★★
()
Ответ на: комментарий от frame

Это же не процессор, а FPGA. Кроме того, Virtex 5, в зависимости от модификации стоит от $100 до $3000. Да и жрёт поболее. Так что - «немного» другая специфика получается.

KRoN73 ★★★★★
() автор топика
31 марта 2010 г.
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.