LINUX.ORG.RU

Ответ на: комментарий от NiKel

Ч.т.д. А он на x86. Cell PC пока утопия, имхо. Софта для него нет, а x86 унаследованный софт будут исполнять лучше в ближайшей перспективе.

aist1 ★★★
()
Ответ на: комментарий от aist1

> Т.е. обсчет сложной физики одновременно с выполнением других задач для десктопа - нереально.

А это как-раз то, для чего он предлагается и чего так и не понял Nikel, судя по его последнему посту. Использование процессоров cell нереально при решении несвязных между собой задач ввиде невозможности их загрузки и нереально для решения одной задачи, поскольку такой задачи не нишлось ни на desktop, ни в игровой приставке.

> Для обычных алгоритмов AI его архитектура подходит .. А в этом случае игра не стоит свеч.

О чём и было сказано далеко вверху. Сомнительный выбор аудитории.

anonymous
()
Ответ на: комментарий от aist1

> Тут самое главное, чтобы матрица влезла в память SPE.

sqrt( 256/8 ) = 5.65K . Т.е. N=5650 - это большие матрицы? SLAE больше 2000 редко решают методом Гаусса - ошибка растёт.

anonymous
()
Ответ на: комментарий от anonymous

второй вопрос - анонимус понимает как организуется многозадачность на процессорах? как это один единственный процессор может выполнять одну программу, в то время как уже выполняется другая? ;)

еще наводящий тезисы - зачем нужен в cell этот специальный PPE и еще - чем может быть полезна программисту возможность явного управления исполнения кода на каждом из SPE?

NiKel
()
Ответ на: комментарий от NiKel

> наводящий вопрос - что вы понимаете под программированием? ;) для меня разработка модели, алгоритмов и собственно реализация - части процесса, или что вы еще понимаете под умными программистами? выучивших семантику языка макак с клавиатурой? :)

я отвечу на ваш вопрос, хотя вы и начинаете заводиться. В посте выше указана цепочка действий, которую можно назвать программированием целиком, а можно и разбить на математику-программирование. При этом я ещё не видел программистов параллельных ЭВМ - макак, выучивших семантику. Обычно до параллельных ЭВМ допускаются люди грамотные и проверенные. Те немыслимые тулзы, о которых вы говорили не помогают на этапе проектирования, но их слишком поздно применять на этапе кодирования.

Ладно, ребята, засиделся я с вами, домой пора. Я обычно не вступаю в полемику, а тут что то разчувствовался. Старею, видать ...

anonymous
()
Ответ на: комментарий от anonymous

Вот тут я не спец. Просто прикинул кол-во точек при просчете реальной сцены, например, врезающегося в стену автомобиля. Чтобы это было реалистично.

А другие алгоритмы, в которых ошибка растет не так быстро, эффективней в плане вычислительных затрат. У меня в голове бродит смутное воспоминание, что метод ниже, чем O(N^3) - это лучшие алгоритмы. Могу ошибаться.

Но если O(N^3), то SPE будут загружены достаточно и не будут простаивать.

aist1 ★★★
()
Ответ на: комментарий от NiKel

> второй вопрос - анонимус понимает как организуется многозадачность на процессорах? как это один единственный процессор может выполнять одну программу, в то время как уже выполняется другая? ;)

посчитайте пропускную способность шин комманд и данных, подумайте, способны ли вы при такой архитектуре как в cell обеспечить непрерывный поток и того и другого. Посмотрите на объёмы доступной регистровой памяти в каждом PE, сравните это с объёмом локальной памяти. Подумайте также о пропускной способности обычной памяти XDR DRAM.

anonymous
()
Ответ на: комментарий от anonymous

> Те немыслимые тулзы, о которых вы говорили не помогают на этапе проектирования, но их слишком поздно применять на этапе кодирования.

вот именно - эта немыслемость и родилась в вашей голове как страшный всемогущий демон, а было сказано В ПОМОЩЬ программисту, не было сказано, что они САМИ вообще все смоделируют, спроектируют и запрограммируют, а умный программист в это время будет сидеть и хлопать в ладоши :)

в то же время полезность автоматизации распараллеливания и векторизации тем же компилятором не отрицается, более того создаются и используются компиляторы фортрана для параллельных вычислений

NiKel
()
Ответ на: комментарий от aist1

<А другие алгоритмы, в которых ошибка растет не так быстро, эффективней в плане вычислительных затрат. У меня в голове бродит смутное воспоминание, что метод ниже, чем O(N^3) - это лучшие алгоритмы. Могу ошибаться.

Называются итерационными со сложностью n*N^2, где n - количество итераций на решение. Если итерационный алгоритм сходится, он компенсирует набегающую ошибку. Некоторые из них очень хорошо векторизуются.

anonymous
()
Ответ на: комментарий от anonymous

>Показательно, что не с BSD. Саааааааныч, выходи, старый хрыч!

И без Саныча на этом сайте отмороженных линуксоидов есть кому про BSD сказать. Короче - нахрен BSD на Cell. (NetBSD все равно сделают но код FreeBSD наверно останется без этого. И это хорошо). Пусть кластеры на Cell делают а не нормальные серверы.

anonymous
()
Ответ на: комментарий от anonymous

> посчитайте пропускную способность шин комманд и данных, подумайте, способны ли вы при такой архитектуре как в cell обеспечить непрерывный поток и того и другого. Посмотрите на объёмы доступной регистровой памяти в каждом PE, сравните это с объёмом локальной памяти. Подумайте также о пропускной способности обычной памяти XDR DRAM

может и не могут обеспечить все, но кое что могут, а более быстрых шин и памяти на десктопах не наблюдается

вообще предлагаю больше думать не о том, чего мы не можем, а о том что мы МОЖЕМ сделать полезного, попытаться осознать новые возможности, которые нам дает новая архитектура, еще раз говорю - кто сможет её грамотно использовать - не прогадает ;)

можно упорно повторять: "этого быть не может, не может ..", потом: "этого не будет, не будет ..", затем: "этого нету, нету ..", ну а потом останется только повторять: "это не я, не я .. " :)

NiKel
()
Ответ на: комментарий от anonymous

Ага, что-то помню, даже помню, что нам именно таки и говорили :)

Ну, в таком случае, как мне кажется, инженеры из IBM правильно расчитали, позиционируя архитектуру cell для решения систем дифуров, раз итерационный метод еще более требователен к вычислительным ресурсам, чем метод Гаусса. И, наверное, они расчитывали именно на итерационныме методы, ведь FPU в SPE - 32-битные.

aist1 ★★★
()
Ответ на: комментарий от NiKel

Железку, которая изобретена уже давно, сделать проще, чем написать софт, алгоритм которого еще не изобретен. Софта нету и не предвидится.

aist1 ★★★
()
Ответ на: комментарий от aist1

< раз итерационный метод еще более требователен к вычислительным ресурсам

n << N!! менее требователен. А некоторые и векторизуются хорошо (это значительно важнее).

anonymous
()
Ответ на: комментарий от anonymous

При больших N - да. Ну все равно, уже при, например, N = 10, n = 5, мы получаем порядка 500 операций. Это гораздо дольше, чем время пересылки 10 32-битных чисел из памяти. Реальные N будут в районе 1000, субъективно (исходя из размера картинки на экране). Может еще оказаться, что шина простаивать будет :)

Я щас прикинул в уме. При моделировании динамики зрительной коры мозга, а это не только анализ, но еще и синтез изображений (зрительных образов), участки коры разбиваются на блоки. Интенсивность сигналов внутри блоков будет примерно в 1000-10000 раз выше, чем между блоками (исходя из значений скорости распространения импульса по коротким и длинным аксонам). Так что и здесь ядра Cell простаивать не должны.

aist1 ★★★
()
Ответ на: комментарий от aist1

Ой, ступил немного с расчетом. Но всё равно...

aist1 ★★★
()
Ответ на: комментарий от anonymous

>Ладно, ребята, засиделся я с вами, домой пора. Я обычно не вступаю в полемику, а тут что то разчувствовался. Старею, видать ...

Ээээ... позвольте... :) Ну что же такое! В другой ситуации я бы, конечно, промолчал... Вы извините, конечно... но, гхм..., щас скажу: я хочу у Вас учиться... (мда..., до чего дошел... :) ) У меня алиби :) - Вы ведь сами понимаете, что я сразу все понял... или хотя бы оставьте возможность советоваться с Вами, вот мой email из тех, что вспомнил denpol (сабака) list.ru

Пишу не со своего компьютера. Вот.
domenick

anonymous
()
Ответ на: комментарий от aist1

> Инфы минимум.

Тут при желании можно получит SDK и дополнительную документацию. http://www.ageia.com/novodex_downloads.html

сам же чип я привел как пример аппаратного решения ускорения физики (не обязательно в играх - это могут быть какие то демонстрационные модели, анимация для видео и так далее), на мой взляд нечто подобное может быть реализовано вполне на базе Cell процессоров при разработке соответсвующих драйверов, инструментов и SDK для тех кто этим будет пользоваться.

С одной стороны Cell специфичный процессор, с другой - универсальный, гораздо более гибкий и универсальный, чем любые CPU на современных десктопах, он может с той или иной эффективностью обрабатывать и традиционные десктопные офисные задачи (хотя давно говорилось что для них он не предназначен и эффективность будет оставлять желать лучшего, но скорости тем не менее для них будет достаточно, хотя бы потому что большинство этих "десктопных деловых приложений" возникли во времена i386-Pentium процессоров, экстенсивно развиваясь до сегодняшнего дня), так обрабатывать и специальные задачи для которых сейчас создаются специальные процессоры вроде GPU или аудиочипов, при правильном использовании он может быть очень эффективным для широкого круга задач, по эффективности приближаясь к специализированным видео или приведенном выше "физическому" процесору. Эти задачи могут быть настолько непривычными и особенными, что на современных CPU они фактически не решаются, а современные приложения их всячески обходят и избегают или полагаются на какие то экзотичные или специализированные аппаратные реализации. Это очень сильная заявка - раньше на десктопах ничего подобного не было. Как я уже говорил - решался довольно узкий класс задач под которые создавались все более быстрые процессоры, а когда требовалось нечто явно выходящее за их возможности (технологические или архитектурные) привлекались специализированные платы, чипы и устройства.

В этом свете современные пентиумы будут чем то вроде специализированными процессорами для обработки электронных таблиц и офисных приложений :) На фоне селлов они будут выглядеть перекачанными монстрами для довольно специфичных задач, некогда так и почти единственно необходимыми для "обычных пользователей". В силу специфичности пни конечно будут превосходить в таких задачах более мощные и универсальные Cell-ы. Иными словами "традиционные приложения" означает те приложения, которые хорошо подходят для пентиумов и наоборот :) Кажется, что и быть не может иначе. Но достаточно будет сделать пару шагов в другом измерении (скажем распознавание образов, обработка потоковых данных и речи, алгоритмы искусственного интеллекта и моделирования динамических систем) и совеременное царство x86 окажется серым, жалким и убогим, мало на что полезным для других "обычных ползователей" завтрашнего дня :)

NiKel
()
Ответ на: комментарий от NiKel

Здесь согласен.

Вот только надо посмотреть реальности в глаза. Нету этих алгоритмов распознавания образов, нету алгоритмов распознавания речи, нету алгоритмов AI. Если бы они были, они были бы уже повсеместно, и дело тут вовсе не в вычислительной мощности. Гиганская выч. мощность там нужна только на этапе исследований, когда детализация объекта моделирования максимальная, как в том проекте по моделированию мозга. Когда же алгоритм найден есть и задача имеет полиномиальные решения, алгоритм быстро оптимизируют до сложности O(N^3), а то и гораздо лучше.

Боюсь, что эти "пару шагов" пока делать некуда. Из перечисленного пока есть только сопромат.

Сорри. 3 часа ночи. Я спать.

aist1 ★★★
()
Ответ на: комментарий от lenin

Дыкйопта нам функциональность тех самых спецвычислителей и нуна.

SPECTATOR
()
Ответ на: комментарий от aist1

да верно - железо само по себе не панацея, нужны люди, которые его используют или могут использовать, какие то алгоритмы наверняка есть, но наверняка были произведены соответствующие оценки, оценки производительнсти CPU, стоимости разработки специализировнных чипов, их перспективы и было сделан вывод: не при нашей жизни. :) Два порядка чистой вычислительно мощи сильный довод. То, что считалось не реальным или реальным через 10-15 лет можно попробовать сделать уже завтра. Исследования и имеющиеся наработки могут получить второй шанс.

Вообще кто заинтересован в задачах, допускающих распараллеливание или алгоритмами, которые могут быть эффективно реализованными на такой архитектуре могут уже задуматься, хотя бы в плане мысленных экспериментов :) Можно начать уже сейчас делать что то, расчитывая на железо кторого пока нет, на те же PS3 с линуксом когда они будут наконец доступны. Невозможное станет возможным, а на основе предварительных наработок быстро получено готовое решение и оно может быть востребованым и интересным, может даже для многих ;) PS3 могут быть популярными, и такими же популярными могут стать удачные решения для них, пусть и кажущиеся сейчас невозможными или ненужными.

NiKel
()
Ответ на: комментарий от anonymous

Путь решения физической задачи на компьютере:

Задача -> метод решения -> алгоритм -> код -> компьютер

В чем проблема скептиков? Они привыкли уже, что у них есть

Задача -> метод решения -> алгоритм

И им уже не охота думать, разрабатывать что либо, зачем ведь у нас уже есть решение, правда для нашей задачи необходимо год чтобы получить какие -либо разумные результаты. И тут появляется Cell, с огромными заявленными потенциальными расчетными мощьностями, но чтобы его эффективно использовать, надо зачастую не только выкинуть имеющиеся уже наработки в алгоритме -> код, но зачастую искать полностью новую цепочку решения в том числе и разрабатывать математический аппарат и метод, не все на это способны. В основном критики об этом и говорят, то неэффективно, тут малая пропускная способность, тут не то, там не то. Никто не предлагает использовать Cell для любых задач, но вполне возможено, что есть круг задач где его использование будет очень эффективно, но опять же для этого надо развивать в том числе и мат. аппарат.

anonymous
()
Ответ на: комментарий от anonymous

Ну и набредили Вы тут про перспективы "Cell". Еще и детального описания нет, а ему уже сказочное будущее напророчили. Как правильно заметили траспьютеры впрок не пошли. Многие сегодняшние DSP могут класторизоваться и ценник у таких плат приемлемый и перфоманс большой. Но чтото не очень народ бросается думать и переделывать. Так о чем флуд? Новый компьютер Sucaba? Повелись на сладкие сказки?

zZzZ
()
Ответ на: комментарий от lenin

>>У универсального проца Селл производительность скромная для сегодняшнего дня. 220 Mflops - это суммарная производительность всех спец. вычислителей.

Я может что-то путаю, но в PS3 их 9 штук - 8 рабочих и 1 на управление.

jackill ★★★★★
()
Ответ на: комментарий от jackill

Серавно ктонить полноценный линух и забутит=)

anonymous
()
Ответ на: комментарий от jackill

>>Я может что-то путаю, но в PS3 их 9 штук - 8 рабочих и 1 на управление.

вроде там одно ядро зарезали - оставили одно главное и 7 вычислителей. (т/е какая то урезанная вариация Cell на одно ядро, хотя может мой склероз пиздит :-)

anonizmus
()

к стати насчет вычислений на джифорсах, у кого-нибудь тут что то получалось полезное? наверняка придется пересаживаться на какую-нибудь PCI видеокарту, ибо джифорсина может зависнуть, заглючить или отказаться нормально выводить картинку если её насиловать левыми инструкциями, возможно придется исползовать модифицированный драйвер чтобы нагружать её своими задачками, положительный опыт есть какой-нибудь?

NiKel
()
Ответ на: комментарий от anonizmus

> вроде там одно ядро зарезали - оставили одно главное и 7 вычислителей. (т/е какая то урезанная вариация Cell на одно ядро, хотя может мой склероз пиздит :-)

да, то ли на тестовом экземпляре, то ли вообще в PS3 собираются оставить только 7 из 8, вероятно по причинам тепловыделения, говорят что выключение одного SPE на производительности почти не скажется, ну а там со временем может техпроцесс улучшат и тогда задействуют все 8

NiKel
()
Ответ на: комментарий от NiKel

>>к стати насчет вычислений на джифорсах, у кого-нибудь тут что то получалось полезное?

У нас на работе звукорежи говорили что есть реально работающий софт, который юзает GPU для расчета сложных звуковых спецэффектов. Вроде бы как раз на картах от nVidia работает, вообще если это кому-то интересно - могу уточнить, как он называется.

Карта дополнительная вроде как не нужна - потому что задействован блок 3D, а 2D свободен.

anonizmus
()
Ответ на: комментарий от anonymous

> Что есть физический эффект? При наличии ресурсов (времени, денег, специалистов), я думаю можно подобрать задачу, которая покажет высокую (10-20% пиковой) производительность на cell. Но вновь, мы ведь обсуждаем PlayStation? Ну или desktop. Количество людей, способных программировать сильносвязные системы эффективно невелико, стоят они дорого, глупостями заниматься не хотят.

Вооооот чего я долго ожидал, ревность! программёры параллельных машин, элита можно сказать, ну не хочет пускать на свою территорию "лемингов", ведь они попрут и растопчут все правила, законы и принципы, годами нарабатываемые этой элитой. Хочется вспомнить показательную историю про маленькую фирмочку, развивавшую всего-то ничего, маленькую програмку под названием Окна, и добавлявшую к ней приложения, так необходимые обычным белым воротничкам и прочим геймерам на забаву. На каком железе это всё работало и вспоминать стыдно. Занятие тогда "большим" программёрством, особенно многозадачных систем было подобно рукотворному волшебству, результатами которого гуру снисходительно награждали простолюдинов.

"Однажды в студёную зимнюю пору я из лесу вышел - был сильный мороз..." - таким же пацаном с треухом, подвозившим дровни и был х86 на заре своего появления.

и что мы имеем сейчас? рынок, те самые белые воротнички и геймеры, потребности которых были весьма далёкими от результатов труда гуру, но коих было в страшное число раз больше тех, кто пользовался "магией" гуру проспонсировали прогресс х86 и превратили обычные калькуляторы с терминалом в машины, делающие влёгкую по мощности монстров того времени. Кстати можно поспорить, кто двигал прогресс сильнее, мейнфреймы или "калькуляторы", сдаётся мне, что популярность х86, двигала техпроцесс намного сильнее чем мейнфреймы (а точнее соотношение числа юзеров х86 и числа юзеров мейнфреймов). Стадо бродячих муравьёв сожрёт слона в считанные минуты, элита не должна об этом забывать :))), рынку не нужны "самые-самые" решения, ему нужны решения, оптимальные по _совокупности_ качеств...

anonymous
()
Ответ на: комментарий от anonymous

> Стадо бродячих муравьёв сожрёт слона в считанные минуты

ну, раз уж пошли аллегории, "белые воротнички" с их способом потребления сродни саранче. кпд стремится к нулю, хотя, нельзя не признать, что свои потребности они, в конечном счете, удовлетворяют. но какой ценой...

ultimate_dumb
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.