LINUX.ORG.RU

Самый мощный суперкомпьютер - голубой ген


0

0

Представители компании IBM заявили, что производительность прототипа новой системы Blue Gene/L достигает 36 терафлоп.
Прототип находится в городе Рочестер, штат Миннесота, работает на базе 16250 процессоров.
Национальная лаборатория им. Лоуренса Ливермора (LLNL) планирует ввести полномаштабный BlueGene/L в эксплуатацию в 2005 году. Он объединит в себе 130 тыс. процессоров, а его пиковая производительность достигнет около 360 терафлоп.
Рекорд, принадлежащий японскому кластеру Earth Simulator от NEC, побит.

>>> Подробности



Проверено: Demetrio ()

Я чё то не понял из статьи, а Линуксе будут делать поддержку 130 тыс.

процессоров в рамках single system image?

Sun-ch
() автор топика
Ответ на: комментарий от Sun-ch

Нет конечно. Я незнаю почему они его называют суперкомпьютером, там будет просто кластер с раздельными нодами, но с общей файлухой.

green ★★★★★
()

_будет_ побит...

Когда введут в эксплуатацию.

Отметим, что откровенно экстенсивный путь: 16k процессоров дают 36Тфлопс (флоп_С_, а не флоп: FLoat OPerations per Second), тогда как в Earth Simulator -- 4k процев обеспечивают 41Tplops.

Извините, но чем больше производительночть на один проц, тем ниже у нас накладные расходы на обмен промежуточными результатами...

Я это к тому, 360Tflops не будет ни в каком разе... Хотя бы уже потому, что 130000/16250*36=288

Ergo: 250 в пике будет в лучшем случае. Да и это будет цифра ради рекорда, по большей части.

Const
()
Ответ на: комментарий от green

Любой современный супер является кластером.

Пардоньте, но насколько я помню, более 64 процев на общей памяти ещё никто не сделал (NUMAой в меня не кидайте, -- это не _общая_ память)

Const
()

Это что за заголовок?

Хех! не обратил внимания, что оно с заголовком шутит ;)))

Последний мой пост был ответом green'у

Const
()
Ответ на: комментарий от Const

Ну прсто такая классификация мне непонятна, ну чем он суперкомпьютер? это не SSI кластер и задания запущенные на одной ноде на другую не попадают, нужно юзать специальные либы или костыли чтобы растягивать задания по куче нодов. Причем часть жтих нодов вообще обеспецивают только файлуху, например.

green ★★★★★
()
Ответ на: комментарий от green

Всё очень просто!

2green

Есть достаточно "стандартное" определение кластера: высокопроизводительная система, построенная на _ординарных_ деталях (ну, утрируя, взяли писишки, соединили езернетом и получили кластер).

Однако, если мы хотим улучшить показатели, то мы должны по мере сил избавляться от классических узких мест кластера. А это, в первую голову, обмен сообщениями. Потому супер предполагает, что львиную долю средств вбухали в разработку особой архитектуры объединения узлов, а не в покупку процессоров ;)

Да и остальное железо здесь чаще не из магазина, а разработанное специально для.

Const
()
Ответ на: Всё очень просто! от Const

Ну я незнаю что там в BGL такого не из магазина. Процы и мамки и сетевухи и винты и контроллеры и все прочее - из магазина... Софт - тоже... ;)

green ★★★★★
()
Ответ на: Всё очень просто! от Const

они уже есть .. главное чтоб денег хватило
InfiniBand,Gigabit Ethernet, SCI, Myrinet, Quadrics.
Процессоры тоже играют роль / архитектура узла/.

anonymous
()
Ответ на: комментарий от Sun-ch

>А на этом ящике расшифровывался генотип челека.

причём "челека" нетрадиционной ориентации :) иначе с чего бы он голубой ?

AlexGor
()

Странно, а у IBM (http://www.research.ibm.com/bluegene/index.html) этих новостей ещё нет... Последние от 21 июня. И результаты там более скромные.

Кстати, по идее правильнее читать "Голубая Джин", слово Gene написано и в оригинале с большой буквы, что превражает его в имя собственное. Истчник www.lingvo.ru ;-)

atrus ★★★★★
()
Ответ на: комментарий от green

> Нет конечно. Я незнаю почему они его называют суперкомпьютером, там будет просто кластер с раздельными нодами, но с общей файлухой.

Earth Simulator - тоже "просто кластер". И что, не суперкомпьютер уже?

Vond ★★
()
Ответ на: комментарий от Const

> Отметим, что откровенно экстенсивный путь: 16k процессоров дают 36Тфлопс (флоп_С_, а не флоп: FLoat OPerations per Second), тогда как в Earth Simulator -- 4k процев обеспечивают 41Tplops.

А вы в курсе, какие процессоры использовались в Earth Simulator и сколько они могут стоить? PowerPC ИМХО на порядок дешевле должны быть.

Vond ★★
()
Ответ на: комментарий от atrus

Угу, а еще оно говорит, что это Женя. Женя Пидорас, чем не перевод.

Все мой оффтоп закончен, по теме сказать нечего.

set
()
Ответ на: комментарий от chucha

Не совсем так. В указаном линке сказано, что роль фундаментальная, хотя действительно в узлах там некая очень простая система. Интересно, а Windows там будет где-нибудь использоваться? :)

Hokum ☆☆☆☆
()
Ответ на: комментарий от Sun-ch

> Я чё то не понял из статьи, а Линуксе будут делать поддержку 130 тыс. процессоров в рамках single system image?

нет, пока Irsi не одобрит, не будут.

anonymous
()
Ответ на: комментарий от Const

> NUMAой в меня не кидайте, -- это не _общая_ память

это общая память. только Non-Uniform Access к ней. ;) Да, это не SMP, безусловно.

ivlad ★★★★★
()
Ответ на: комментарий от green

> Ну я незнаю что там в BGL такого не из магазина

MyriNET, конечно, тоже из магазина. Только не из любого. ;)

ivlad ★★★★★
()

Наверное на систему гарантированного питания и охлаждения они потратят не меньше, чем на сам кластер. Если как узел используется двухпроцовый сервак, то потребление узла будет где-то 500 Вт. Т.е. в общей сумме получится 32,5 МВт. Выделяемое тепло тоже будет где-то в этих пределах.

alexros
()
Ответ на: комментарий от set

> Угу, а еще оно говорит, что это Женя. Женя Пидорас, чем не перевод.

Такой вариант тоже рассматривался, но был отвергунт по причине неблагозвучия... ;-))))

atrus ★★★★★
()
Ответ на: комментарий от Const

> Я это к тому, 360Tflops не будет ни в каком разе... Хотя бы уже потому, что 130000/16250*36=288

какие мы быстрые... вам из IBM письмо пришло что будут использованные точно такие же процессоры или лично начальник проекта позвонил? :)))

HellAngel ★★
()
Ответ на: комментарий от ivlad

oxonian (*) (30.09.2004 16:47:30):

>> NUMAой в меня не кидайте, -- это не _общая_ память

> это общая память. только Non-Uniform Access к ней. ;) Да, это не SMP, безусловно.

С точки зрения программы ccNUMA совершенно аналогична SMP. Более того, при одинаковой тактовой частоте процессоров для типичных счетных задач она почти не уступает настоящему SMP (из-за 'cc').

Die-Hard ★★★★★
()

Неужели ещее кто-то серьезно относится ко всяким бенчам в том числе top500? это натурально понты, для поднятия престижа

Dubrovsky
()
Ответ на: комментарий от Const

в субже general-purpose CPU, а в NEC специализированные и моща основная в векторных сопроцах, потому ГЕН более рульная вещь:

http://www.es.jamstec.go.jp/esc/eng/Hardware/arithmetic.html

Construction of Arithmetic Processor (AP)

Each AP consists of a 4-way super-scalar unit (SU), a vector unit (VU), and main memory access control unit on a single LSI chip. The AP operates at a clock frequency of 500MHz with some circuits operating at 1GHz. Each SU is a super-scalar processor with 64KB instruction caches, 64KB data caches, and 128 general-purpose scalar registers. Branch prediction, data prefetching and out-of-order instruction execution are all employed. Each VU has 72 vector registers, each of which has 256 vector elements, along with 8 sets of six different types of vector pipelines: addition/shifting, multiplication, division, logical operations, masking, and load/store. The same type of vector pipelines works together by a single vector instruction and pipelines of different types can operate concurrently. The VU and SU support the IEEE 754 floating-point data format.

1 Chip LSI : 8Gflops 0.15µm CMOS 8Layers copper interconnection 20.79mm x 20.79mm 60 million transistors 5185 pins Clock Cycle: 500MHz(1GHz) Power Consumption: 140W (Typ.)

anonymous
()
Ответ на: комментарий от alexros

> Если как узел используется двухпроцовый сервак, то потребление узла будет где-то 500 Вт. Т.е. в общей сумме получится 32,5 МВт. Выделяемое тепло тоже будет где-то в этих пределах.

Ну IBM не зря лучших инженеров держит. Почитайте, в сумме порядка 1 МВт потребление у них.

Vond ★★
()
Ответ на: комментарий от Vond

> Никогда :)

Никогда не говори "никогда" ;)

PS: Возможно ныне применяемые в процессорах физ. процессы и не обеспечат такой производительности, но наука то на месте не стоит.

sS ★★★★★
()
Ответ на: комментарий от green

>Ну я незнаю что там в BGL такого не из магазина. Процы и мамки и >сетевухи и винты и контроллеры и все прочее - из магазина... Софт - >тоже... ;)

Мамки и контроллеры -- однозначно нет.

P.S. Извиняюсь, что так не сразу ;)

Const
()
Ответ на: комментарий от Vond

>А вы в курсе, какие процессоры использовались в Earth Simulator и >сколько они могут стоить? PowerPC ИМХО на порядок дешевле должны быть.

В курсе.

Очень этим интересовался...

А вам доводилось писать эффективную масштабируемую параллельную программу?

Это к тому, что при наличии визможности 5000 процессоров лучше чем 100000 при одинаковой суммарной производительности

Const
()
Ответ на: комментарий от HellAngel

2HellAngel

>какие мы быстрые... вам из IBM письмо пришло что будут использованные >точно такие же процессоры или лично начальник проекта позвонил? :)))

Вообще-то в таких проектах _всё_ отлаживается очень подробно под конкретные железки. То есть если данный процессор был в прототипе -- он будет и в окончательном варианте.

И объясняется это простой вещью: ежели машина стоимостью под 10^9 зелёных купюр будет глючить, виноват будет тот, кто предложил заменить железку на другую на этапе перехода от прототипа к.

А потому ни звонка, ни письма для подоюных утверждений не надо.

Грубо говоря: это вам не домашний комп, в котором хочу -- проц разгоню, а не хочу, -- поменяю. Цена ошибки _очень_ другая.

Const
()
Ответ на: комментарий от Die-Hard

2Die-Hard

>С точки зрения программы ccNUMA совершенно аналогична SMP. Более того, >при одинаковой тактовой частоте процессоров для типичных счетных задач >она почти не уступает настоящему SMP (из-за 'cc').

С точки зрения программы -- да.

А с точки зрения производительности... Извините, но если необходимая область массива не лезет во вторую из 'cc', то хорошо написанный код для кластера поэффективнее будет.

Const
()
Ответ на: 2HellAngel от Const

>> Вообще-то в таких проектах _всё_ отлаживается очень подробно под конкретные железки. То есть если данный процессор был в прототипе -- он будет и в окончательном варианте

не знаю, не учавствовал я в таких проектах, но кто вам сказал что изначально была установка на процессоры с конкретной частотой, размером кеша и числом ядер? м.б. изначально отладка и тестирование велись для нескольких версий и запущена система была в таком виде из каких угодно соображений (например - маркетинговых или по т.з. у них была четко модель оговорена)

HellAngel ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.