IBM построит самый быстрый суперкомпьютер в мире на процессорах Cell

0

0

IBM была выбрана NNSA для строительства самого мощного суперкомпьютера в мире с производительностью 1 петафлопс (пиковая 1.6 петафлопс). Тогда как самый быстрый суперкомпьютер Blue Gene в настоящее время имеет производительность 280 терафлопс.

В кластере будет использована гибридная архитектура, на основе 16000 процессоров Opteron и 16000 Cell.

Процессоры общего назначения Opteron будут выполнять системные задачи (файловый ввод/вывод, обмен траффиком и т. д.), тогда как Cell будут выполнять непосредственно вычислительные задачи.

В качестве платформы будет использована IBM System x 3755 для Opteron и IBM BladeCenter H для Cell.

Операционная система - Linux.

>>> Подробности (на английском)

Ссылка

←	They shall not be broken into

KOffice: Summer of Code Students Deliver the Goods

→

← 1 2 3 →

Ответ на: комментарий от anonymous 08.09.06 12:55:15 MSD

> обойдя RHEL4 с втрое большим количеством процессоров :-)

В _чём_ обойдя ? В пЕаре ? Оно там в жопе со всех концов

sS ★★★★★
(08.09.06 15:49:38 MSD)

Ответ на: комментарий от sS 08.09.06 15:49:38 MSD

Сильно сказано, в фортунки! =))

~~Gharik~~ ☆
(08.09.06 16:26:31 MSD)

Ссылка

Ответ на: комментарий от sS 08.09.06 15:37:55 MSD

>но на 2.4.x

правильно, там треды это замаскированный процесс.

alphex_kaanoken ★★★
(08.09.06 17:26:03 MSD)

Ссылка

Что, у директора IBM комплекс маленькой пиписьки?

anonymous
(08.09.06 17:56:47 MSD)

Ссылка

Ответ на: комментарий от sS 07.09.06 19:46:24 MSD

>MPICH2 http://www-unix.mcs.anl.gov/mpi/mpich2/ (13 мегов)

Судя вот по этому:

MPICH2 replaces MPICH1 and should be used instead of MPICH1 except for the case of clusters with heterogeneous data representations (e.g., different lengths for integers or different byte ordering). MPICH2 does not yet support those systems (support is planned for late 2006).

Оно все же не работает пока еще с нодами на разных платформах... :-(
То есть, на кластере из x86_32 и х86_64 ее не запустишь (разная длина int)

>MPICH-G2 (для grid) http://www.hpclab.niu.edu/mpi/

А вот это должно бы работать...

MPICH-G2 automatically converts data in messages sent between machines of different architectures and supports multiprotocol communication by automatically selecting TCP for intermachine messaging and (where available) vendor-supplied MPI for intramachine messaging.

~~R00T~~ ☆
(08.09.06 18:24:27 MSD) автор топика

Ответ на: комментарий от sS 08.09.06 15:49:38 MSD

> обойдя RHEL4 с втрое большим количеством процессоров :-)
>В _чём_ обойдя ? В пЕаре ? Оно там в жопе со всех концов
Скорее в жопе на всех концах :-)))

anonymous
(08.09.06 18:42:47 MSD)

Ссылка

Ответ на: комментарий от sS 08.09.06 15:49:38 MSD

>В _чём_ обойдя ? В пЕаре ? Оно там в жопе со всех концов
Вспомни анекдот про двух бегунов, я писал по аналогии :-)

anonymous
(08.09.06 18:43:53 MSD)

Ссылка

Ответ на: комментарий от R00T 08.09.06 18:24:27 MSD

>Судя вот по этому:

>MPICH2 replaces MPICH1 and should be used instead of MPICH1 except for the case of clusters with heterogeneous data representations (e.g., different lengths for integers or different byte ordering). MPICH2 does not yet support those systems (support is planned for late 2006).

Ну возьмите 1-й (там сцилки были). HPL-ю много не нужно ;) А вот GoToBLAS весьма ему рекомендован ;) Хотя если не собираетесь попадать в top500 сойдёт и ATLAS ;)

PS: Именно из за этого мы используем PVM который для гетерогенщины by design да и вообще более приятный в кодировании (сугубо ImHO) и более высокоуровневый в плане парадигмы.

sS ★★★★★
(08.09.06 19:18:48 MSD)

Ссылка

Ответ на: комментарий от anonymous 08.09.06 12:55:15 MSD

>Это называется Windows 2003 уверенно выходит на рынок кластерных систем, обойдя RHEL4 с втрое большим количеством процессоров :-)

Это тебе где такое привиделось, болезный? Дай-ка циферку.

anonymous
(08.09.06 21:14:24 MSD)

Ответ на: комментарий от anonymous 08.09.06 21:14:24 MSD

>Это тебе где такое привиделось, болезный? Дай-ка циферку.

отвечу вместо анонимуса: сцылка там была - но тем, у кого проблемы с чуйством юмора она не поможет :)

bsh ★★★
(08.09.06 23:42:34 MSD)

Ссылка

Ответ на: комментарий от anonymous 08.09.06 12:55:15 MSD

Это в какой строчке?

jackill ★★★★★
(09.09.06 02:19:49 MSD)

Ответ на: комментарий от anonymous 08.09.06 10:47:07 MSD

> если интел лучше, почему тогда решили использовать Оптероны?

Потому что у Intel нет Torrenza для Cell http://www.overclockers.ru/hardnews/23274.shtml

anonymous
(09.09.06 07:56:11 MSD)

Ссылка

Все грамотные инженеры-схемотехники, рассуждают как нужно строить суперкомпьютеры. Обсуждать идею IBM могут люди, занимающиеся схожими проблемами. Думаю здесь не более 2 человек таких

Sadist ★
(09.09.06 13:40:31 MSD)

Ответ на: комментарий от Sadist 09.09.06 13:40:31 MSD

> Все грамотные инженеры-схемотехники, рассуждают как нужно строить суперкомпьютеры. Обсуждать идею IBM могут люди, занимающиеся схожими проблемами. Думаю здесь не более 2 человек таких

и вы - один из них, а анонимус - второй? ;)

посчитаем цифирьки (верхний предел грубо):

CELL одинарная точность: 16000 x 256 GFlops = 4.096 PFlops

CELL двойная точность: 16000 x 25 GFlops = 0.4 PFlops

Opteron: 16000 x 10 GFlops = 0.16 PFlops

ну и где петафлоп (мы о двойной точности говорим)? вот она, голая правда, петафлоп может быть получен только на одинарной точности! а на двойной верхний предел это пол-петафлопа, причём в пике!

любознательным на закуску:

Ю.Митропольский. "Мультиархитектура – новая парадигма для суперкомпьютеров":

http://www.electronics.ru/pdf/3_2005/09.pdf

filin ★★
(09.09.06 21:37:53 MSD)

Ответ на: комментарий от filin 09.09.06 21:37:53 MSD

Рекомендую в этой же книге. а лучше в какой другой, прочитать, что такое MFLOPS.

Millions of FLoating point Operations per Second

И каждый трактует это измерение по своему. Есть Flops, есть Linpack, к примеру. И результат будет разный.

Что касается новости:

The U.S. Department of Energy's National Nuclear Security Administration (NNSA) has selected IBM to design and build the world's first supercomputer to harness the immense power of the Cell Broadband Engine™ (Cell B.E.) processor aiming to produce a machine capable of a sustained speed of up to 1,000 trillion calculations per second, or one petaflop. The 'hybrid' supercomputer, codenamed Roadrunner, will be installed at DOE's Los Alamos National Laboratory. In a first-of-a-kind design, Cell B.E. chips -- originally designed for video game platforms -- will work in conjunction with systems based on x86 processors from Advanced Micro Devices, Inc. (AMD). Designed specifically to handle a broad spectrum of scientific and commercial applications, the supercomputer design will include new, highly sophisticated software to orchestrate over 16,000 AMD Opteron™ processor cores and over 16,000 Cell B.E. processors in tackling some of the most challenging problems in computing today. The revolutionary supercomputer will be capable of a peak performance of over 1.6 petaflops (or 1.6 thousand trillion calculations per second).

Перевести тебе слово "over" или ты горазд только комменты читать и дурацкие вычисления делать, не зная архитектуры?

jackill ★★★★★
(10.09.06 02:10:21 MSD)

Ответ на: комментарий от jackill 10.09.06 02:10:21 MSD

>И каждый трактует это измерение по своему. Есть Flops, есть Linpack, к примеру. И результат будет разный.

LOL :)

"Flops" энто что за тест такой :)

еще раз. Есть _теоретическая_ пиковая производительность процессора - Rpeak. Как вычисляется я уже 3 раза написал и привел 2 сцылки. Больше её процессор прыгнуть не может _теоретисески_ Есть реальная _измеренная_ производительность процессора. Меряется на тестах (linpack, SPECfp,...)

Так как мы говорим о проектируемой системе то реальной производительности мы её не знаем. Только теоретическую пиковую (Rpeak). Весь спор идёт про то, какая она будет в реале(Rmax). Замечание про 1.6 петафлопса вообще говоря правильное ибо непонятно чего они там и как посчитали это заявив. Взяли SP точность и помножили на эффективность поверов в совсем другой (негибридной) архитектуре ? Дык это пЕар чистой воды. Никому кроме потребителей игрушек SP сегодня не интересна. А у последних так и вообще большую часть работы выполняют 256-битные GPU которые уже сейчас задвигают в пике бумажный целл в SP куда подальше.

sS ★★★★★
(10.09.06 15:38:46 MSD)

Ответ на: комментарий от jackill 10.09.06 02:10:21 MSD

> Рекомендую в этой же книге. а лучше в какой другой, прочитать, что такое MFLOPS.

> Millions of FLoating point Operations per Second

> И каждый трактует это измерение по своему. Есть Flops, есть Linpack, к примеру. И результат будет разный.

я считал верхний предел (максимальную теоретическую пиковую производительность), причём грубо, тупым суммированием анонсированной теоретической производительности:

http://www.blachford.info/computer/Cell/Cell1_v2.html

(кому нужны числа из первоисточника, ковыряйтесь сами в недрах доков IBM, числа от IBM <= этим) на многопроцессорной машине получить выше этого предела даже теоретически невозможно, поскольку интерконнект (задержки) только уменьшит этот предел.

Если бы я говорил об измеренном значении (на тестах), то на многопроцессорной машине можно иногда получить "прибавку" в силу увеличенного суммарного кеша, как, например, пишут Bil Lewis и Daniel J. Berg в книге "PThreads Primer: A Guide to Multithreaded Programming". Но измеренное на практике значение _всегда_ меньше теоретического, поскольку теоретическое пиковое значение предполагает, что fp юниты загружены всегда, а на практике они какое-то время простаивают.

> Перевести тебе слово "over" или ты горазд только комменты читать и дурацкие вычисления делать, не зная архитектуры?

ну "комменты читать" видимо не я один горазд, иначе бы не получил "ответа" от вас ;)

спасибо, я знаю, что over означает "над", "выше", поэтому как получить один или "больше" петафлопа на даблах, я не понимаю

жду аргументированного доказательства почему мои "вычисления дурацкие", и какие вычисления надо произвести, чтобы получить петафлоп в "даблах". Может у вас инсайдерская инфа есть? Поделитесь, плиз ;)

filin ★★
(10.09.06 19:14:53 MSD)

Ссылка

Ответ на: комментарий от sS 10.09.06 15:38:46 MSD

> Взяли SP точность и помножили на эффективность поверов в совсем другой (негибридной) архитектуре ? Дык это пЕар чистой воды. Никому кроме потребителей игрушек SP сегодня не интересна. А у последних так и вообще большую часть работы выполняют 256-битные GPU которые уже сейчас задвигают в пике бумажный целл в SP куда подальше.

он не бумажный, с ним уже системы дают, но не всем :)

"...Prototypes of the Mercury CAB are now available in limited volumes. Production availability is planned for the first quarter of calendar 2007. Pricing for the Mercury Cell Accelerator Board starts at US$7,999 for a single board, with discounts available on higher volumes."

http://www.mc.com/mediacenter/pr/news_details.cfm?press_id=2006_07_31_0900_10...

а его "полезность", как утверждает википедия, для вычислений в даблах всё равно будет:

"...For double-precision, as used in personal computers, Cell performance drops by an order of magnitude, but still reaches 14 GFLOPS. According to the latest research Lawrence Berkeley National Laboratory Cell's double precision performance is at least three times as powerful as the best desktop processors, including Itanium and Opteron"

http://en.wikipedia.org/wiki/CELL

пока голубой гигант чешется, амд с интелем выпустят четырёхядерные процы и тогда посмотрим, кто кого по price/performance ;)

filin ★★
(10.09.06 19:56:21 MSD)

Ответ на: комментарий от filin 10.09.06 19:56:21 MSD

>он не бумажный, с ним уже системы дают, но не всем :)

Но его _реальных_ тестов пока никто не видел. Либо их тщательно "скрывают от общественности" ;) (почему ?)

Так что либо результаты тестов архитектуры 1PPE +8 SPE плачевны Либо так "дают" что никто потестировать его не смог ;)

Как бы ложка не опоздала к обеду.

sS ★★★★★
(10.09.06 20:43:30 MSD)

Ссылка

Ответ на: комментарий от filin 09.09.06 21:37:53 MSD

Они сделали всё гораздо хитрее. Сначала считают Linpack с одинарной точностью на Целле, а потом итеративно уточняют на двойной. В результате получается нечто среднее: 1 ПФлоп. Только я не пойму, нафиг так извращатся, ведь это только один, далеко не самый распространённый, алгоритм, и к другим такой подход может быть неприменим. Многие задачи вообще в одинарной точности не считаются в принципе.

RedAndr
(11.09.06 01:09:44 MSD)

Ссылка

Ответ на: комментарий от jackill 09.09.06 02:19:49 MSD

>Это называется Windows 2003 уверенно выходит на рынок кластерных систем, обойдя RHEL4 с втрое большим количеством процессоров :-)
>Это в какой строчке?
Смотрим три последние строчки:
Windows 2003 Server 1 0.20 % 2090 4752 660
RedHat Enterprise 4 2 0.40 % 9651 15754 1888
Windows Compute Cluster Server 2003 1 0.20 % 4106 5760 900

Вспоминаем анекдот:
Сегодня прошли соревнования двух бегунов. Наш пришел одним из первых, по количеству шагов и частоте пульса с большим отрывом обойдя противника. Его соперник пришел предпоследним. :-)

anonymous
(11.09.06 11:56:42 MSD)

Ссылка

Ответ на: комментарий от anonymous 08.09.06 10:47:07 MSD

> если интел лучше, почему тогда решили использовать Оптероны???

Если оптероны лучше, тогда почему вудкресты их рвут в сравнительных тестах на всех сайтах? ...или ты тормоз, отстал от жизни и давно их не читал? ...или ты фонатег АМД?

anonymous
(11.09.06 15:00:24 MSD)