LINUX.ORG.RU

Linux для процессоров Cell


0

0

Процессор Cell, разработанный Sony, Toshiba и IBM известен как сердце
игровой консоли PlayStation 3. Однако, пока очень мало известно об ином
применении Cell.

На конференции LinuxTag 2005, проходящей с 22 по 25 июня в Германии,
представитель IBM Arnd Bergmann расскажет о модели программирования Cell
под Linux и о ядре Linux, используемом в первой рабочей станции,
оснащенной Cell, которая также будет представлена на Linuxtag 2005.

Оригинал на /.

>>> Подробности

★★★★★

Проверено: Casus ()

Ответ на: комментарий от anonymous

Не путай рабочую станцию и десктоп.

А терминал - не такая уж и плохая вещь. Никто не мешает держать тонкий терминал дома. На фига эндлузеру полноценный компутер?!?

VLugovsky
()
Ответ на: комментарий от NiKel

>например сопроцессорные числодробильни

Нельзя. Ознакомься со спецификацией на Cell на предмет точности его FP

Кстати из-за этого же всякие G5 отсысывают со своим алтивеком у тех же

P4/AXP/A64 с их SSE(1/2/3)

Как игроваю консоль/PC общего назначения - пожалуйста.

sS ★★★★★
()
Ответ на: комментарий от VLugovsky

> Надо только всем шустро изучать пи-исчисление и писать навороченные оптимизации для параллельной комбинаторной редукции графов.

Папа, ты сейчас с кем разговаривал? (с) анекдот

:)))

vada ★★★★★
()
Ответ на: комментарий от sin_a

>>> Целеронам все равно до пня далеко

>> Товарищ анонимус, запомните, а лучше запишите Cell и Celeron это разные вещи ;)

>От спасибо... А то я сам так и не вьехал, что над этой фразой все так падают... :) (пополз:)

(из под стола) Меня добил...

Гыгыгыгы :)))

vada ★★★★★
()
Ответ на: комментарий от sS

Это всё совершенно несущественные мелочи. Младшие модели INMOS-ов вообще без плавучки были, и никого это не напрягало.

VLugovsky
()
Ответ на: комментарий от VLugovsky

>Это всё совершенно несущественные мелочи.

Угу. Только не надо при этом про "числодробление" говорить.

Это онанизм а не числодробление ;)

sS ★★★★★
()
Ответ на: комментарий от aist1

>В Cell будет только float, но не double ?

Они там гордо пообещали double-precision floating-point multiplier ;)

Видимо как мегафичу. Гы ;)

sS ★★★★★
()
Ответ на: комментарий от VLugovsky

>Госпидя, да хто ж про числодробление то гойворит?!?

Я там отквотил кто. Все вопросы туда ;)

sS ★★★★★
()

    Коллеги! Многие из Вас слишком радикальны в своих выводах о том кто кого похоронит. Мне ближе иное мнение. Вы, наверное, заметили, что процессорные гиганты конкуренты на рынке и их позиции примерно одинаковы по уровню применяемых технолокий и производительности. Но, заметте, что к этому паритету они пришли каждый своим путем, т.е. со своими отличными от других архитектурными идеями. И вот каждая компания решила снова увеличить производительнось: Intel и AMD - двухядерность, а IBM - ?. Подумали ребята из IBM и увидели, что 2 ядра G5 ну никак не выдают необходимый результат за приемлимые расходы. Что делать? А давайте оставим 1 ядро, а к нему добавим кучку маленьких одинаковых ядер, которые займутся тем, что у основного ядра получается очень медленно. Проверили - результат оправдал себя. Алло, это отдел маркетинга ... 

Михаил.

anonymous
()
Ответ на: комментарий от sS

Ага! т.е. double precision сорее всего делается в PPE. С другой стороны, обработка речи во многих случаях FPU вообще не требует, просто float-версии алгоритмов более универсальны в смысле динамического диапазона обрабатываемых сигналов. Тоже самое касается любой обработки сигналов, где есть фильтрация или FFT: int32 - достаточно, float - хорошо, double - излишество. На сколько я понимаю, double необходим только там, где быстро накапливается погрешность машинного округления.

aist1 ★★★
()
Ответ на: комментарий от Sun-ch

>сверхпроводников в бошку вживлять, да чё то наверное не получилось.

ну почему не получилось? все у них получилось, только их подопытный сбежал из лаборатории и теперь побирается нейрочипом по форумам под ником ссаныч

anonymous
()
Ответ на: комментарий от anonymous

>Точнее линукс запускается на Playstation2. Ни в BIOS ни в RTE линукса
>нет.

Я не про запускается, а о том, что сам BIOS на основе переделанного линукса, скорее всего RT-Linux, многие названия функций в драйверах
чисто линуксячии, да и слово linux там тоже в пару местах находится...

McMCC ★★★
()
Ответ на: комментарий от McMCC

McMCC:
>Я не про запускается, а о том, что сам BIOS на основе переделанного линукса,(...)

Вообще-то это оччень сенсационные обвинения- в таких дырах GPL код
находили- а тут вдруг знаменитая Sony PS2- и за столько лет никто ничего?..
Или я чего-то не понимаю?..

PS а если даже там и впрямь Linux, стратегически выгоднее решить вопрос
без лишнего шума...

Anonymous ★★★★★
()
Ответ на: комментарий от sS

> Peak performance (single precision): > 256 GFlops # Peak performance (double precision): >26 GFlops

> как говориться - "почувствуй разницу"

sS только ты забыл добавить один момент:

> the theoretical peak performance of the Intel 3GHz Pentium4 using SSE instructions is only 6GFlops.

(http://www.blachford.info/computer/Cells/Cell2.html)

Гы - вот теперь и почувствуй разницу, хехе ;)

imo не стоит сильно переживать по поводу того, что SPE ядра 32битные и ориентированы на целочисленные или дробные вычисления с обычной точностью - суммарный запас гигафлопсов у них огромный, во вторых есть множество задач где родной для SPE точности float вполне достаточно, imo использованием double часто неоправдано злоупотребляют, быть может потому, что на современных x86 процессорах простые операции с double столь же эффективны как и с float операндами (если пересылка большего обьема данных не проблема), в некоторых книжках по программированию так и советуют - избегайте использования float переменных в пользу double, чтобы избегать лишних накладных расходов по преобразованию типов в смешанных операциях, то есть люди где надо и не надо обьявляют double без особой надобности в них .. а что касается особых числодробильных задач, то для них и точности double может быть уже недостаточно, нужны скажем long double или long long double или еще более экзотичные типы ..

NiKel
()
Ответ на: комментарий от NiKel

А Итаники рулят ?)))))))

>imo не стоит сильно переживать по поводу того, что SPE ядра 32битные

У-у-у. Так оне еше и 32 битные? И как там 64 разриадная ОСь побежит? Или удел этих ядер калькулировать? Нет ребята, подход АМД/Интел мне все же ближе. Если новейший процессор имеет 32 разряда в 2005 году, то дал'ше приставок и видеогнитофонов ему не поднятся. Или я неправ?

Nalyvajko
()
Ответ на: комментарий от anonymous

2Михаил.

А вот меня смущает совсем другое. Без конца пролетают ньюсы что линукс портировали на тот камень, на этот камень, туда, сюда...

Ну и где, собственно, для конечного пользователя? Ну для меня и моей компании? Где производители железа? Кудя не глянь, везде на борде х86.

Теперь и яблок на интел переезжает. Куда податься, с этого гребаного х86, бедному юзеру???? Неужто этот х86 настолько круче пасхального яйца, что все другие камни это скорее "небесные кренделя", чем реальность!

Хочу Е2К, Селл, Арм,... на борде!!!!! Дате! А уж линукс мы заведем!

vada ★★★★★
()
Ответ на: А Итаники рулят ?))))))) от Nalyvajko

>Или я неправ?

Неправ. Не в разрядности дело, а в количестве перемолотой информации за единицу времени. Разрядность тут не последний по важности фактор, но и не первый.

vada ★★★★★
()
Ответ на: А Итаники рулят ?))))))) от Nalyvajko

> У-у-у. Так оне еше и 32 битные? И как там 64 разриадная ОСь побежит? Или удел этих ядер калькулировать? Нет ребята, подход АМД/Интел мне все же ближе. Если новейший процессор имеет 32 разряда в 2005 году, то дал'ше приставок и видеогнитофонов ему не поднятся. Или я неправ?

2Nalyvajko Неправ. Почитай немного об архитектуре Cell (тут например http://www.blachford.info/computer/Cells/Cell1.html ) и многие вопросы отпадут ;)

На русском тут: http://www.3dnews.ru/cpu/cell/ .. Тогда будет меньше заблуждений и предрассудков в эфире :)

NiKel
()
Ответ на: комментарий от NiKel

А сколько стоит решение для HPC на базе Cell? 1) Сколько стоит Ось ? 2) Есть ли MPI/OpenMP/HPF/PVM реализации ? 3) Чем собирать программы на f77/f90/f95 с (2) ?

psi
()
Ответ на: комментарий от psi

ты о чем psi? :) Cell-ов еще в продаже нету, может через год будут :)

NiKel
()
Ответ на: комментарий от NiKel

> Peak performance (single precision): > 256 GFlops # Peak performance (double precision): >26 GFlops > the theoretical peak performance of the Intel 3GHz Pentium4 using SSE instructions is only 6GFlops.

Да видели мы этих "сферических коней в вакууме" на примере G5

на бумаге G5 типа заруливал топовые Оптероны а в реальности слил AXP и Р-М с более низкой частотой. Подробности смотреть на http://tabsnet.de

sS ★★★★★
()
Ответ на: комментарий от sS

зарелизят - будет видно конкретно, а пока пускай себе x86 доживает :) может до выхода PS3/Cell еще на двухядерном атлоне покатаюсь..

уродливую x86 спас закон Мура, он будет действовать и далее, но уже не будет спасительным кругом для интела, в концептуальном плане многоядерные интелы и им подобные - извращение, это все те же большие и толстые универсальные CPU, но уже в количестве 2/4/8/16 .. неэффективные и уродливые, имеющие множество внутренних ухищрений, реализующих параллелизм и анализ исполняемого кода, загнанные до упора частоты конвееров и многоуровневые кэши, то есть огромная вычислительная фабрика на одном кристалле, которую технология позволяла успешно изготавливать все более тонким образом, а продолжением и апофеозом этой идеологии должен был стать мерсед, то бишь итаник - большой, могучий проц на базе совершенных техпроцессов, но тут же imo подкрались два капца - первый: тепловыделение, за частоты и вычислительные операции надо расплачиваться энтропией, то есть банальным теплом, в количествах на единицу площади которые материал уже не выдерживает физически, тут уже удвоение числа транзисторов не помогает и второй момент: скорость распространения сигналов - начиная с техпроцессов порядка 60нм времена распространения сигналов в большом кристалле уже начинают носить статистический характер, чего раньше не было, то есть мы уже достоверно не можем сказать успеет ли сигнал из одной части процессора дойти до другой за данный промежуток времени, и дальнейшее увеличение числа транзисторов и тактовых частот делает наш кристалл все более трудно управляемым - надо строить сигнальные цепи на базе все более и более сложных схем на основе статистических моделей. Вот они - элементы пределов роста, это и есть физический кризис и тупик идеологии больших и толстых электрических CPU - законы природы заставляют делиться и интелу ничего не остается как запихивать в один кристалл прежние монструозные ядра, достигшие уже своих пределов роста. На разработку и выпуск новой распределенной процессорной архитектуры нужно как минимум 5 лет, а ставки были сделаны на издыхающий в муках итаник. Когда наборы инструкций и архитектура Cell станет стандартом индустрии де факто интелу останется лишь как то её клонировать и лицензировать, а IBM тем временем на месте стоять не будет ..

NiKel
()
Ответ на: комментарий от VLugovsky

>>Ну так надо расстрелять всех жабабыдлокодеров, а те, кто останется, прекрасно справятся и с написанием параллельного софта. Надо только всем шустро изучать пи-исчисление и писать навороченные оптимизации для параллельной комбинаторной редукции графов.

Угу. Только помимо этого для грамотных параллельных вычислений нужно знать еще и model chercking, ctl, ltl, структуры крипке и еще много чего. А то потом вылезают такие штуки как, скажем resource starvation (правда это скорее не в ПВ а в хитрых организациях dataflow, ну да близкие вещи).

А так - да, согласен

der_steppen_wolf
()
Ответ на: комментарий от NiKel

Я не понимаю массовой эйфории по поводу пректирования ещё одного специализированного процессора, коих было не счесть числа. Если отбросить рекламную шелуху из цитированных тобой выше статей, то что останется? 1 управляющий сложный процессор и 8 вычислительных сравнительно простых векторных конвейера (по 4 потока на целочисленные данные и плав. точку) с распределённой памятью (регистры через программно управляемый 256K кэш через довольно медленную общую шину к памяти)? Ну и что? Все, кто хотя бы раз программировал векторный конвейер знают, что проблема не в том, чтобы быстро сложить/умножить два числа/вектора, а в том, чтобы эти самые операнды быстро подготовить, причём обеспечивать загрузку ALU постоянно. Что мы видем в Cell - простые сверх быстрые процессоры и медленная общая шина памяти, отсутствие возможности обращения к регистам соседнего SPE, 128x128 регистров при 256K реально доступной памяти. Не грех вспомнить, почему Cray-1 останавливался, как только производилась операция с блоком векторных сортировок и зачем в Cray-2 увеличивали пропускную способность шины к память. Все это уже давным-давно было и закончилось очень смешно.

anonymous
()
Ответ на: комментарий от alebu

>центрального процессора, обвешенного специфилескими сопроцессорами

T100 v terminatore :)

ne pomnyu tolko skolko tam yadryshek bylo prilepleno odno k ondomu :))))

AcidumIrae2
()
Ответ на: комментарий от anonymous

>Что мы видем в Cell - простые сверх быстрые процессоры и медленная общая шина памяти, отсутствие возможности обращения к регистам соседнего SPE, 128x128 регистров при 256K реально доступной памяти.

разве общая? и кеш они друг у друга адресовать могут

Anonymous ★★★★★
()
Ответ на: комментарий от NiKel

>а русском тут: http://www.3dnews.ru/cpu/cell/ .. Тогда будет меньше заблуждений и предрассудков в эфире :)

Ya plakal' :)

---------------------------

Существует три варианта развития событий. Первый - Apple будет продолжать использовать процессоры PowerPC 970FX/970MP. Второй - Cell будет применён в ноутбуках компании, тогда как PowerPC 970FX/970MP - в остальных продуктах. И, наконец, третий - Apple полностью перейдёт на Cell, используя его во всех своих компьютерах.

AcidumIrae2
()
Ответ на: комментарий от Anonymous

Если совсем правильно, то разделяемая, разбитая на 4 однонаправленных канала. Согласно рис http://www.3dnews.ru/cpu/cell/ Синергический процессорный элемент, адресация регистров (!! а не кэш) соседнего элемента отсутствует, а передача данных осуществляется через local memory, что и есть тот самый кэш. Доступ к кэш программируем самим синергическим процессорным элементом, но нет ни одного упоминания об адресации памяти соседних элементов.

anonymous
()
Ответ на: комментарий от NiKel

2NiKel

>уродливую x86 спас закон Мура, он будет действовать и далее, но уже не будет спасительным кругом для интела, в концептуальном плане многоядерные интелы и им подобные - извращение, это все те же большие и толстые универсальные CPU, но уже в количестве 2/4/8/16 .. неэффективные и уродливые

Как раз эффективные. Подожди, сейчас двухядерные процы выпускают плоскими, а через годик освоят производство 3хмерных, как пирог, кристаллов. Да, каждый слой-ядро такого кристалла будет медленнее, но в сумме они спокойно будут давать >4 ГГц при томже тепловыделении. И тогда 10 ГГц на кристалл к 2010 году станет реальностью. Кстати, вроде недавно проскакивала новость про этот выверт производителей чипов, только не помню каких.

Михаил.

anonymous
()
Ответ на: комментарий от anonymous

>Доступ к кэш программируем самим синергическим процессорным элементом, но нет ни одного упоминания об адресации памяти соседних элементов.

как раз пытаюсь найти, и где я это вычитал?.. но ведь точно помню, причем не весь кеш, а 128кб...


до кучи
http://www.research.scea.com/research/html/CellGDC05/

Anonymous ★★★★★
()
Ответ на: комментарий от anonymous

>И тогда 10 ГГц на кристалл к 2010 году станет реальностью
а что Вы называете "ГГц"?

Anonymous ★★★★★
()
Ответ на: комментарий от anonymous

многослойные чипы уже есть, пока обкатывают технологию на относительно простых чипах памяти но с ними возникнет проблема эффективного отвода тепла - с плоскими структурами это делать намного проще, чем с обьемными, опять же электрические наводки ..

насчет повышенных частот интел занимается оптическими шинами передачи данных, но пока они еще далеки от внедрения

суперкомпьютеры давно ушли от идеи большого единого суперпроцессора, отстаиваемой некогда Креем (он говорил, типа на на паре волов пахать лучше, чем на тысяче циплят) .. вот и пришло время суперкомпьютеров на чипе и для простых смертных, пентиумы с их длинными конвеерами и большими кристаллами работающих на больших частотах уходят в прошлое .. не сразу - у них есть еще лет 5-6 (до сих пор еще ведь работают где то компьютеры 2000 года выпуска), ну а за это время они или приспособятся или уйдут на обочину конкурируя там с AMD, выпуская наборы микросхем для разных мобильных и встраеваемых систем, опять же инерция рынка и пользователей - кому то нужны супер скорости и суперграфика, а кому то и пасьянса хватает вполне :) Производители консолей следующего поколения уже отказались от интеловских процессоров, то же самое произойдет и с десктопами в массе своей - будут интеловские ноутбуки, какие то дешевые настольные решения для экзоманов и ретардов - Applе, например - они сами об этом мечтали :) В суперкомпьютерах и кластерах быстро откажутся от x86 после появления производительных, и дешевых селлов, в консолях и бытовой электронике уже отказались или отказываются, ниша для x86 будет все уже и уже с каждым днем ..

NiKel
()
Ответ на: комментарий от vada

2vada

>Хочу Е2К, Селл, Арм,... на борде!!!!! Дате! А уж линукс мы заведем!

Начинай деньги копить... Вот и мне интересно, когда Слаку портируют на Cell, на S/390 сделали же?

Михаил.

anonymous
()
Ответ на: комментарий от anonymous

2vada

>Хочу Е2К, Селл, Арм,... на борде!!!!! Дате! А уж линукс мы заведем!

>Начинай деньги копить... Вот и мне интересно, когда Слаку портируют на Cell, на >S/390 сделали же?

>Михаил.

Нет, поставлю вопрос ребром - пока Слаку не портируют на Cell, пусть даже не заикаютя о нём! :))

Михаил.

anonymous
()
Ответ на: комментарий от Anonymous

Посмотрел. Получил дополнительное подтверждение. Cell будет иметь очень большие проблемы при обработки больших массивов неструктурированных данных. Т.е. фактически любых данных, поскольку объём доступной памяти слишком мал, а обмен дорог.

anonymous
()
Ответ на: комментарий от anonymous

А сколько денег -- то копить надо?

anonymous
()
Ответ на: комментарий от NiKel

>...два капца - первый: тепловыделение, за частоты и вычислительные операции надо расплачиваться энтропией, то есть банальным теплом, в количествах на единицу площади которые материал уже не выдерживает физически, тут уже удвоение числа транзисторов не помогает и второй момент: скорость распространения сигналов - начиная с техпроцессов порядка 60нм времена распространения сигналов в большом кристалле уже начинают носить статистический характер, чего раньше не было, то есть мы уже достоверно не можем сказать успеет ли сигнал из одной части процессора дойти до другой за данный промежуток времени, и дальнейшее увеличение числа транзисторов и тактовых частот делает наш кристалл все более трудно управляемым - надо строить сигнальные цепи на базе все более и более сложных схем на основе статистических моделей. Вот они - элементы пределов роста, это и есть физический кризис и тупик идеологии больших и толстых электрических CPU - законы природы заставляют делиться и интелу ничего не остается как запихивать в один кристалл прежние монструозные ядра, достигшие...

Подобные частушки апокалипсушки я слышал лет деять назад, дословно. Тогда, кажется, с математической строгостью доказывали что процессор в 1 ГГц - миф, и быть такого не может.

Nalyvajko
()
Ответ на: комментарий от NiKel

> ...суперкомпьютеры давно ушли от идеи большого единого суперпроцессора, отстаиваемой некогда Креем (он говорил, типа на на паре волов пахать лучше, чем на тысяче циплят)...

И где он неправ?

>Производители консолей следующего поколения уже отказались от интеловских процессоров...

сомневаюсь что это связано с недостаточной производительностью...

Nalyvajko
()
Ответ на: комментарий от NiKel

>...уродливую x86 спас закон Мура, он будет действовать и далее, но уже не будет спасительным кругом для интела, в концептуальном плане...

Что-то я не понимаю о каких концепциях идет речь. Из ваших слов можно сделать вывод что сушествует одна правильная концепция, которая не ограничена сушествуюшими технологиями, и приведет мир к процветанию, и имя ей ЦЕЛЛ. Вот как раз все ет целлы, и цыплята и есть те самые ухищрения и костыли призваные обойти _временные_ технологические трудности.

>...многоядерные интелы и им подобные - извращение, это все те же большие и толстые универсальные CPU, но уже в количестве 2/4/8/16 .. неэффективные и уродливые, имеющие множество внутренних ухищрений, реализующих параллелизм и анализ исполня...

Бла-бла-бла. похоже на какуюто маркетинговую чепуху.

> а IBM тем временем на месте стоять не будет ..

a intel тем временем на месте стоять не будет ...:)

за последних 10-15 лет появлялись и уходили в прошлое PowerPC, Alpha, Transmeta, Itanium, итд, итп а х86 живет и здравствует. Не поймите меня неправильно, я не против нового, я за! Помну как я радовался появлению PowerPC! шуmу было не меньше чем сегодниашним героем. Вот уж думал я, конец нанависному х86, пришeл мессия, и все старое и уродливое отойдет в прошлое, а на его месте появится что-то совешенно новое и красивое. Прошло 12 лет...

Nalyvajko
()
Ответ на: комментарий от psi

>Ты папутал с титаником бывает

А ты думал кликуха "Итаник" откуда?

Nalyvajko
()
Ответ на: комментарий от NiKel

>> У-у-у. Так оне еше и 32 битные? И как там 64 разриадная ОСь побежит? Или удел этих ядер калькулировать? Нет ребята, подход АМД/Интел мне все же ближе. Если новейший процессор имеет 32 разряда в 2005 году, то дал'ше приставок и видеогнитофонов ему не поднятся. Или я неправ?

2Nalyvajko Неправ. Почитай немного об архитектуре Cell (тут например http://www.blachford.info/computer/Cells/Cell1.html ) и многие вопросы отпадут ;)

На русском тут: http://www.3dnews.ru/cpu/cell/ .. Тогда будет меньше заблуждений и предрассудков в эфире :)

Хм... и где я не прав? Мне интересно как етот чудо камнь ускорит например компиляцию проекта и позволит мне в это время шарится в интернете?

Nalyvajko
()
Ответ на: комментарий от Nalyvajko

2Nalyvajko Ну что ты взялся спорить после слов:

> У-у-у. Так оне еше и 32 битные? И как там 64 разриадная ОСь побежит?

не лучше ли потратить пока время и втыкать потихоньку что Cell за зверь такой? :) Так сказать, расширять узкие места :) Информации нарыть можно много, а до светлого будущего еще дожить надо, в ближайшие пол года-год никаких особых перемен не предвидится, есть время покумекать что делать дальше и как оно все может повернуться ;) .. И если только сегодня пришло знание, какой грядет кульный проц - это знание еще переварить надо, информация правда пока общая, а конкретые тулсы, либсы и сорсы обещают выдать совсем скоро, ну а когда выйдет PS3 - пощупать можно будет и лично, наверняка тому времени и Linux соорудят для PS3. C учетом того, что железо консолей поступает после релиза ниже себистоимости это будет довольно неплохое приобретение - можно будет и поработать, потестить, и поигратся во что нибудь на ней же :)

NiKel
()
Ответ на: комментарий от NiKel

>не лучше ли потратить пока время и втыкать потихоньку что Cell за зверь такой? :) Так сказать, расширять узкие места :)

почитал, и понял, что "make -j 8" на етом камне будет примерно тоже что и "маке -j 2".

Nalyvajko
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.