LINUX.ORG.RU

Суперкомпьютер на ARM занял первое место в TOP500

 , , ,


0

1

22 июня был опубликован новый TOP500 суперкомпьютеров, с новым лидером. Японский суперкомпьютер «Fugaki», построенный на 52 (48 вычислительных + 4 под ОС) ядерных процессорах A64FX, занял первое место, обогнав в тесте Linpack прошлого лидера, суперкомпьютер «Summit», построенный на Power9 и NVIDIA Tesla. Данный суперкомпьютер работает под управлением Red Hat Enterprise Linux 8 с гибридным ядром на базе Linux и McKernel.

Процессоры ARM используются всего в четырёх компьютерах из TOP500, причём 3 из них построены именно на A64FX от Fujitsu.

Несмотря на использование процессоров на архитектуре ARM, новый компьютер всего на 9 месте по энергоэффективности с параметром 14.67 Гфлопс/Вт, тогда как лидер в этой категории, суперкомпьютер MN-3 (395 место в ТОП500), обеспечивает 21.1 Гфлопс/Вт.

После ввода Fugaki в строй, Япония, имея всего 30 суперкомпьютеров из списка, обеспечивает порядка четверти суммарной вычислительной мощности (530 Пфлопс из 2.23 Эфлопс).

Самый мощный компьютер России, «Christofari», являющийся частью облачной платформы Сбербанка, находится на 36 месте и обеспечивает примерно 1.6% максимальной производительности нового лидера.

>>> Подробности

★★★★★

Проверено: alpha ()
Последнее исправление: alpha (всего исправлений: 6)

Вангую 2021 год - год ARM’a. Apple, похоже, задаст моду. Хорошо это или плохо - покажет время. Но в целом я за разнообразие на десктопе. И это как раз оно.

mshewzov ★★
()

Надо думать ядра цпу там только для обеспечения работы видеокарт. Иначе как могло оказаться, что второе место с ядрами power уступает в 3 раза при на порядок большем числе ядер?

kirill_rrr ★★★★★
()

Не смотря на использование -> Несмотря на использование

anonymous
()

Стоило добавить про 512-битный SIMD у A64FX, что видимо и стало решающим фактором хорошей производительности на тестах.

AlexVR ★★★★★
()
Последнее исправление: AlexVR (всего исправлений: 1)
Ответ на: комментарий от kirill_rrr

у второго места на узле два проца по 22 ядра + 6 видеокарт NVidia Volta GV100 (5376 CUDA ядер + 672 тензорных ядер). При этом карты с процами соединены по NVLink и разделяемой ОЗУ.

AlexVR ★★★★★
()
Ответ на: комментарий от AlexVR

У поверов 22 ядра, да к тому же SMT4, т.е. 4 потока на ядро. Есть у них и SMT8, но на более малоядерных процах.

Demacr ★★
()
Ответ на: комментарий от BceM_IIpuBeT

Сбывается моя мячта. x86 просто так позиции не сдаст, ARM будет заходить через макаки, а значит писать кроссплатформенный софт без костылей типа Wine будет всё популярнее. От этого автоматически выигрывает Linux

I-Love-Microsoft ★★★★★
()

Спецификация для Fugaku: https://www.r-ccs.riken.jp/en/fugaku/project/outline

Из интересных фактов:

Второе место это симбиоз IBM+NVidia+Mellanox в хорошем исполнении но в 2U сервере.

У Fujitsu всё в одном камне. Даже их интерконнект TofuD. Как следствие получаем 384 узла на стойку от одного вендора.

AlexVR ★★★★★
()
Ответ на: комментарий от perl5_guy

16С, 2021+, только появятся, плюс год строить, но рекордов не возьмет. А оно прям надо в топ-10? Сколько стран не имеют супер компьютеров вовсе? Там где есть это хотя бы для чего то нужно

Fujitsu A64FX Common manufacturer(s): TSMC

И никто не ноет по этому поводу, не проклинает Японию, не считает что дешевле было бы у Intel купить и прочее подобное

I-Love-Microsoft ★★★★★
()
Ответ на: комментарий от Demacr

И тем не менее, не самая подходящая для этого nv2080 вчетверо быстрее. Надо думать что они при этом дешевле и возможно потребляет меньше энергии.

kirill_rrr ★★★★★
()
Ответ на: комментарий от I-Love-Microsoft

И никто не ноет по этому поводу, не проклинает Японию, не считает что дешевле было бы у Intel купить и прочее подобное

А ты всерьёз обращаешь внимание на нытьё этих тупых педрл? Давай Эльбрус Про-3000 делай. Новый суперкомп. Покоритель нерешённых задач. Ща даже лозунг придумаю – «я тебя вычислю сука!». Ну как, звучит?

anonymous
()
Ответ на: комментарий от kirill_rrr

и этого SIMD (для чего он вообще?)?

Векторная арифметика. Смотри SSE, AVX для x86. В 512бит влезает 8 double или 16 float или 32 half float (для любителей нейронок, который походу есть в этом камне) или по аналогии целый числа.

AlexVR ★★★★★
()
Ответ на: комментарий от I-Love-Microsoft

И никто не ноет по этому поводу, не проклинает Японию, не считает что дешевле было бы у Intel купить и прочее подобное

Это что за наезд такой? Я за реальный сектор всегда.

perl5_guy ★★★★★
()

на 9 месте по энергоэффективности с параметром 14.67 Гфлопс/Вт, когда как лидер в этой категории, суперкомпьютер MN-3 (395 место в ТОП500), обеспечивает 21.1 Гфлопс/Вт.

На втором месте по энергоэффективности сибиоз AMD и NVIDIA (7-й по производительности)

Ну, за дружбу!

anonymous
()
Ответ на: комментарий от CryNet

Ну всё. Сейчас все начнут переходить на ARM

Переходи к нам на ARM. Мы все здесь лета-а-а-аем.

anonymous
()
Ответ на: комментарий от I-Love-Microsoft

А есть хотя бв одна причина для нытья?

anonymous
()
Ответ на: комментарий от mshewzov

Хорошо это или плохо - покажет время.

Не хорошо и не плохо. Это решение совета директоров одной из кампаний. Нам, как юзерам, так и девелоперам жить с этим решением.

я за разнообразие на десктопе

Расскажи об этом ИТ-руководителям, админам, эникеям и сервисменам. Придёшь и расскажешь нам, как они отреагировали, разделили твою радость или нет.

И это как раз оно.

Нет, это не оно.

Apple, похоже, задаст моду.

Эппл является раскрученной площадкой для выпендрёжа. Чтобы хомячки носились с выпученными чичами за каждой фиговиной «от Эппл». А моду задают другие ребята. Мы о них никогда не прочтём в яндэкс-новстях.

Эппл был интересен во времена PowerPC.

anonymous
()
Ответ на: комментарий от CryNet

На ARM уже года три как массово переходят.

И не Apple задаёт эту «моду», а цена на электричество.

alpha ★★★★★
()
Ответ на: комментарий от anonymous

Не хорошо и не плохо. Это решение совета директоров одной из кампаний. Нам, как юзерам, так и девелоперам жить с этим решением.

Выше директоров IT корпораций стоит Совет аноанимусов Лоропедов. Так что мимо.

Расскажи об этом ИТ-руководителям, админам, эникеям и сервисменам. Придёшь и расскажешь нам, как они отреагировали, разделили твою радость или нет.

Тыкать сраный Штеуд уже задролбало. Вот бы АРМ потыкать. (с) Эникей.

Никто даже не заметит. Единственное, это бинари отвалятся и часть из них уйдёт в небытиё. Вот и всё. Проблема не требующая решения.

anonymous
()
Ответ на: комментарий от kirill_rrr

Видеокарты рулят в простой, предсказуемой и главное параллелизуемой обработке больших массивов. Много разных действий которые применяются к небольшому количеству данных, зависят от кучи условий и обращаются к результатам вычисления соседнего элемента сведут с ума любую видеокарту. Тут-же речь идет о нормальном сложном коде не о детских детерминированных преобразованиях сотни мегабайт однородных данных разом.

anonymous
()
Ответ на: комментарий от perl5_guy

Где же эльбрусики?! :’(

Суперкомпьютер – это как небоскрёб. Объект требующий постоянных инвестиций. Отрицательное по финансам сооружение. Скажи ещё, что не в курсе? Ну так просвещайся. Если «эльбрусики» начнут пилить суперкомп, то тогда это будет значить, что они там совсем поехали. Пока они этого не делют – всё ок.

Собрать суперкомп можно на процессорах Nuromatrix от Module. У них там есть два выхода к DDR и два выходя для соединения проц-проц. Т.о. можно составить цепочку процессоров, организовав конвейерные вычисления.

Те же япошки делали суперкомп на RISC-V. Что делает твой вскукоерк ещё более глупым. Т.к. базовый проц, его сложность, не имеет никакого значения вообще. Только скорость взаимодействия этих вот базовых единиц. Учись, горбатый.

anonymous
()
Ответ на: комментарий от BceM_IIpuBeT

Разнообразие вендорлоков?

Насколько я знаю, ARM лицензируется направо и налево. Так что если ARM придет на десктоп усилиями Apple и это будет успешным, то остальные не смогут стоять в стороне. Быть может все десктопы, а не только Mac, потом уйдут на ARM и мы получим не два основных поставщика ЦП на рынке десктопов, а в несколько раз больше.

mshewzov ★★
()
Ответ на: комментарий от BceM_IIpuBeT

Да, потому что опенсурс не имеет потенции прокладывать себе дорогу. Его нужно пропихивать по уже проторенной тропе вслед за вендорлоком.

anonymous
()
Ответ на: комментарий от anonymous

Не хорошо и не плохо. Это решение совета директоров одной из кампаний. Нам, как юзерам, так и девелоперам жить с этим решением.

Как и с прошлыми. С ними жили, и с этим поживём.

Расскажи об этом ИТ-руководителям, админам, эникеям и сервисменам. Придёшь и расскажешь нам, как они отреагировали, разделили твою радость или нет.

Я думаю, что в перспективе они даже не заметят ничего. Миграция корпоративных железок на ARM будет небыстрой, плавной и расчетливой. Там x86-64 будет еще очень долго. Пользователи в этом плане более гибкие. Вот с них Apple и начала переход на ARM.

Нет, это не оно.

Да, это оно.

Эппл является раскрученной площадкой для выпендрёжа. Чтобы хомячки носились с выпученными чичами за каждой фиговиной «от Эппл». А моду задают другие ребята. Мы о них никогда не прочтём в яндэкс-новстях.

Эппл был интересен во времена PowerPC.

Не согласен. Apple и сейчас интересна. Просто она другая. Не такая, как во времена Джобса. Стоит вспомнить, что у MS не задалось с планшетами, а вот Apple вывела их на рынок и собственно сам этот рынок и сформировала. С тех пор таких революционных решений у Apple не было. Разве только Mac Pro. И вот переезд на ARM, на мой взгляд, тоже революционное решение.

mshewzov ★★
()
Ответ на: комментарий от anonymous

Но ведь эти монстры строятся для бигдаты. Например десять типовых операций над милиардом строк в таблице/нейронов/вокселей физической модели. Если задача плохо паралелится и одно единственное ядро должно иметь постоянный доступ ко всему массиву данных, это не к суперкомпам. А если всё разбивается на узлы и паралелится, то какая разница, на 48 ядер цп или на ядра куда?

kirill_rrr ★★★★★
()
Последнее исправление: kirill_rrr (всего исправлений: 1)
Ответ на: комментарий от kirill_rrr

Разница есть. Начиная от оптимальной интенсивности вычислений и заканчивая (как сказал анонимус) обработкой ветвлений.

GPU ветвления (if-ы всякие) переживают куда хуже чем CPU.

Ну и на CPU есть еще векторизация, которую почти никто не умеет полноценно использовать.

AntonI ★★★★
()
Ответ на: комментарий от ChekPuk

Как спам-бот для позвонить и предложить-купить-че-то-там он вне конкуренции;-)

AntonI ★★★★
()
Ответ на: комментарий от anonymous

Суперкомпьютер – это как небоскрёб. Объект требующий постоянных инвестиций. Отрицательное по финансам сооружение.

Какие инвестиции? Зарплата обслуживающего персонала и научно-технических кадров, способные строить, писать софт и применять? С точки зрения бюджета это копейки. Железо тоже стоит копейки в сравнении с затратами на подготовку качественного кадрового состава. Наличие суперЭВМ у страны говорит о том, что на ней есть что вычислять. То есть инвестиции в суперЭВМ == инвестициям в средства производства. Если твой завод выпускает мухобойки, то тебе никакие эвээмы не нужны.

Если «эльбрусики» начнут пилить суперкомп, то тогда это будет значить, что они там…

…принимают участие в процессе оздоровления государства. Но до этого ещё очень далеко.

Учись, горбатый.

Вот именно.

anonymous
()
Ответ на: комментарий от anonymous

Наличие суперЭВМ у страны говорит о том, что на ней есть что вычислять.

А отсутствие — что вычислять нечего. Ну, соберут для демонстрации, а дальше?

spqr ★★★
()
Ответ на: комментарий от ChekPuk

Да, это интересно. Сделал ли.

anonymous
()
Ответ на: комментарий от I-Love-Microsoft

И никто не ноет по этому поводу, не проклинает Японию, не считает что дешевле было бы у Intel купить и прочее подобное

Для этого нужно быть крутым специалистом в предметной области (области что на нем собираются считать). Возможно он (этот суперкомпьютер) на.уй не нужен.

А так задним числом: погуглите компьютеры 5 поколения (там еще пролог пихали) и телевидение высокой четкости (аналоговое) (даже к олимпиаде в Сеуле оборудование выпускать начали).

Можно также поинтересоваться японским маглевом (сколько поколений инженеров сменилось, пока решили линию строить).

И да, все это проекты, руководимые МВТП.

Отдельно стоит упомянуть MRJ - из чего его собирались делать и чем закончили. Кстати погуглите, что это второй подобный послевоенный проект, и какова судьба первого (опыт нарабатываем, ага).

И да, где-то в начале 80-х в Америке вышла книга «Japan as Number One: Lessons for America». Вот тогда такой был настрой. И где это все?

P.S. А так да, за Родину, за Сталина (за МИКАДО), Ура.

P.P.S. Тут тебе другой anonymous предлагал Эльбрус Про-3000 делать. Присоединяюсь. Будешь на лоре отчеты публиковать.

anonymous
()
Ответ на: комментарий от anonymous

Какие инвестиции? Зарплата обслуживающего персонала и научно-технических кадров, способные строить, писать софт и применять? С точки зрения бюджета это копейки. Железо тоже стоит копейки в сравнении с затратами на подготовку качественного кадрового состава. Наличие суперЭВМ у страны говорит о том, что на ней есть что вычислять. То есть инвестиции в суперЭВМ == инвестициям в средства производства. Если твой завод выпускает мухобойки, то тебе никакие эвээмы не нужны.

Копейки – это цена твоему высеру в базарный день. Суперкомп – это не решение принимаемое производителями обычных компов. Если ты так и не догнал.

anonymous
()
Ответ на: комментарий от anonymous

Верблюд, залогинься обратно.

anonymous
()

построенный на 52 (48 вычислительных + 4 под ОС) ядерных процессорах A64FX

А сколько всего этих процессоров там?

Upd:

Fugaku uses 158,976 A64FX CPUs joined together using Fujitsu’s propietary Tofu interconnect

Найс, это случаем не та история где 10000 землекопов быстрее трактора?

shpinog ★★★
()
Последнее исправление: shpinog (всего исправлений: 1)
Ответ на: комментарий от spqr

Ага. Вон, есть в МГУ «Ломоносов». И что? А ничего. Показывают студентам.

Перед самым распадом Советов на ЗиЛ (сейчас и завода такого нет) был закуплен многопроцессорный комплекс (на юниксах, кстати) для конструкторско-технологических нужд. Интересно, кто его потырил после распила завода. Вот для этого нужны кластеры, для «тяжёлых» подсчётов железяк и логистики. А не для того, чтобы меряться ЧСВ в top-листах.

anonymous
()
Ответ на: комментарий от mshewzov

разнообразие

Непереносимость —> виртуалки —> медленность. Разные версии софта под разное железо —> баги, дыры в безопасности.

Буэээ.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.