LINUX.ORG.RU
ФорумTalks

Рейтинг суперкомпьютеров top-500 возглавил кластер на ARM-процессорах

 ,


1

2

В Японии запустили суперкомпьютер Fugaku от Fujitsu на базе 48-ми ядерных ARM-процессорах.

  • Cores: 7,299,072
  • Memory: 4,866,048 GB
  • Processor: A64FX 48C 2.2GHz
  • Interconnect: Tofu interconnect D
  • Rmax: 415,530.0 TFlop/s
  • Rpeak: 513,854.7 TFlop/s

При этом он в 2.8 раз мощнее второго места (IBM POWER9+NVIDIA). И на столько же прожорливее

★★★★★

Стагнирующую монополию костыльного x86_64 нужно свергать.

EXL ★★★★★ ()
Ответ на: комментарий от EXL

Стагнирующую монополию костыльного x86_64 нужно свергать.

Может они количеством превзошли и понтуются?

xwicked ★★ ()

Очередной недопроц-замена видеокарты для embarrassingly parallel задач? Вменяемая конкуренция этого в обычном софте с x86 сомнительна.

nvidia ()
Ответ на: комментарий от EXL

Смена кодировки команд практически ничего не даст, кроме сломанной совместимости с софтом. А больше значительной разницы там по сути нет.

nvidia ()
Ответ на: комментарий от xwicked

Может они количеством превзошли и понтуются?

не только, судя по результатам их ARM-ядра на равных с x86-ядрами.

AlexVR ★★★★★ ()
Последнее исправление: AlexVR (всего исправлений: 1)
Ответ на: комментарий от nvidia

Вменяемая конкуренция этого в обычном софте с x86 сомнительна.

С обычным софтом это к Яблочникам. Они десктопы на ARM анонсировали.

А под HPC-кластера давно уже софт собирают из исходников. Иначе теряется выгода от новых процессоров, будь то Intel, AMD, IBM Power и т.д. и т.п.

AlexVR ★★★★★ ()
Ответ на: комментарий от AlexVR

Дело не в сборке, а в том, что только определённые задачи в полной мере могут использовать заявленные флопсы таких железок. В другом софте производительность будет унылая, если у них там не практически полный аналог современных x86 процев кроме набора команд, разумеется.

nvidia ()
Ответ на: комментарий от nvidia

А что тебя там не устраивает? SIMD 512бит, скорость ядра 2,2ГГц. 48 ядер (плюс, возможно, 2-4 ядра). Это вполне себе заточенный под многопоточную математику проц, а не сборка под мобильник.

AlexVR ★★★★★ ()

При этом он в 2.8 раз мощнее второго места (IBM POWER9+NVIDIA). И на столько же прожорливее

И у него в 3 раза больше ядер. И в чем прикол?

vasya_pupkin ★★★★★ ()
Последнее исправление: vasya_pupkin (всего исправлений: 1)
Ответ на: комментарий от AlexVR

Под embarrassingly parallel математику как на видеокартах возможно. А на обычном коде с большим количеством ветвлений и низким параллелизмом вероятно будет уныло.

nvidia ()
Последнее исправление: nvidia (всего исправлений: 2)
Ответ на: комментарий от vasya_pupkin

И на столько же у него больше ядер. И в чем прикол?

Со вторым местом сравнивать сложно, там Power9 + NVidia Volta GV100 с оптимизированной шиной. А тут на одном узле только один проц. Можешь сравнить с 8-м местом

AlexVR ★★★★★ ()
Последнее исправление: AlexVR (всего исправлений: 1)
Ответ на: комментарий от vasya_pupkin

Ну так известно же, что рейтинг перформанса на 1 ядро выглядит как POWER > x86 > ARM. Вот и приходится ARM-у догонять числом ядер.

snizovtsev ★★★★ ()
Ответ на: комментарий от K50

Нужна конкуренция, ибо x86{_64} превратился в стагнирующий совок, готовый сколлапсировать под тяжестью напиханных в него костылей.

EXL ★★★★★ ()
Ответ на: комментарий от snizovtsev

По-моему, x86 в этом впереди, по крайней мере в части задач.

nvidia ()
  • Fugaku - 158976 процев по 48 ядер.
  • Summit - 9216 процев по 22 ядра.

Легким движением руки

в 2.8 раз мощнее

превращается из преимущества в анекдот.

qtm ★★ ()
Ответ на: комментарий от qtm

Ну-ну а про NVidia кто говорить будет с их тысячами ядрами на борту?

AlexVR ★★★★★ ()
Ответ на: комментарий от AlexVR

Окей, пусть будет 158976 против 36864. Что-то принципиально изменилось?

qtm ★★ ()
Ответ на: комментарий от qtm

4608 узлов * ( 2 проца * 22 ядра + 6 видеокарт * ( 5376 CUDA ядер + 672 тензорных ядер)) = 167 417 856 абстрактных ядер

AlexVR ★★★★★ ()
Ответ на: комментарий от qtm

В добавок у IBM один узел занимает 2U в стойке. У Fujitsu 384 узла в стойке

AlexVR ★★★★★ ()
Последнее исправление: AlexVR (всего исправлений: 1)
Ответ на: комментарий от nvidia

Вменяемая конкуренция этого в обычном софте с x86 сомнительна.

ARM64 уже превзошел Зионы на абсолютном большинстве задач и дышит в спину последним Райзенам.

cvv ★★★★★ ()
Ответ на: комментарий от cvv

Сомнительно, тк даже если предположить равный или чуть больший IPC, разница в частоте слишком большая.

nvidia ()
Ответ на: комментарий от ncrmnt

Тормозит Джава только у мамкиных кулькакеров, которым мамка нормальный комп не купила.

У меня и на Rasp'е Джава быстро работает.

Bioreactor ★★★★★ ()
Ответ на: комментарий от Bioreactor

У меня тормоза были с унылой САПРиной на жабе, которая была запущена на серваке (xeon + 1Tb RAM). Мощнее мамка не купит ;)

ncrmnt ★★★★★ ()
Ответ на: комментарий от ncrmnt

с унылой САПРиной на жабе

Конкретно какая «САПРина»?

Кривыми ручонками индусских разработчиков можно прекрасно затормозить gc в Джаве.

Могу даже научить как.

https://www.manning.com/books/bitter-java

Bioreactor ★★★★★ ()
Последнее исправление: Bioreactor (всего исправлений: 1)
Ответ на: комментарий от ncrmnt

Могу только посочувствовать.

Не Вы же разработчик - Вас обязали пользовать это поделие.

-----

Не стОит путать «теплое и мягкое».

Джава - отдельно.

Индусский код - отдельно.

В моей практике постоянно встречается «унаследованный» индусский код типа конкатенации строк вместо заведения StringBuilder.

И это еще «цветочки».

Bioreactor ★★★★★ ()
Ответ на: комментарий от nvidia

и низким параллелизмом

наверно просто такие задачи не стоит обсчитывать на кластере?

cvs-255 ★★★★★ ()
Ответ на: комментарий от Bioreactor

Альтернатив нет) только если массово переходить на тулы от кого-то другого из «большой тройки», но хрен редьки не слаще

ncrmnt ★★★★★ ()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)