NVIDIA объявила начало продаж персонального суперкомпьютера Tesla

0

0

Совместно со своими партнерами, компания NVIDIA разработала Персональный Суперкомпьютер Tesla, оснащенный графическими процессорами на основе архитектуры Cuda. Как было заявлено, компьютеры, использующие Tesla C1060 GPU, работают в 250 раз быстрее среднестатистического десктопа, что позволит выполнять ресурсоемкие вычисления и моделирования без доступа к обычным суперкомпьютерам. Пиковая производительность системы оценивается в 4 TFLops.

Цена одной карты Tesla C1060 $1,699. Полноценный рабочий суперкомпьютер будет стоить порядка $10,000.

Основные характеристики архитектуры:

240 ядер в одном графическом процессоре,
операции с целыми числами и числами с плавающей точкой одинарной и двойной точности (IEEE 754),
производительность каждого графического процессора при работе с числами с плавающей точкой одинарной точности - 933 GFlops, двойной точности - 78 GFlops,
пиковая пропускная способность памяти - 102 GB/s.

Средства для разработки, входящие в комплект поставки, включают в себя компилятор языка С, отладчик и профайлер. А также некоторые численные библиотеки (FFT, BLAS) и библиотеку CuDPP (CUDA Data Parallel Primitives).

Технические характеристики суперкомпьютера:

3 или 4 вычислительных процессора Tesla C1060 с 4 Гб (dedicated) ОЗУ для каждого процессора,
2.33 ГГц 4-ядерный AMD Phenom или Opteron, или же 4-ядерный Intel Core 2 или Xeon,
БП 1200-1350 Watt, подключается к обычной розетке,
уровень шума < 45dbA.

Среди поддерживаемых операционных систем заявлены дистрибутивы GNU/Linux Red Hat Enterprise Linux 4/5 и SUSE 10.1, 10.2, 10.3 (как 32-битные, так и 64-битные).

Более детельно ознакомиться с описанием системы можно на соответствующем сайте NVIDIA Tesla Personal Supercomputer.

Компании, которые будут продавать Tesla Personal Supercomputers: Dell, Lenovo, Asus, Western Scientific и некоторые другие.

>>> Подробности

Ссылка

←	Встреча пользователей Moscow MySQL User Group

Как быть хорошим (и ленивым) сисадмином

→

← 1 2 3 →

Ответ на: комментарий от VIT 25.11.08 22:49:56 MSK

Если интересно, то вот здесь посмотрите:

http://fftw.org/cell/index.html

Там, правда, сами IBM-ы задонейтили код. Но тем не менее прецедент создан.

Кстати, мне как пользователю этой библиотеки (просто сказочно хороша) даже ничего переписывать в моём коде не придётся. За меня другие постарались.

Про CUDA-у подумываю. Под новый проект заказал ноут с Quadro FX, чтобы пощупать за вымя эту штуку.

Успехов!

Crazy_Doctor ★
(25.11.08 23:50:48 MSK)

Ответ на: комментарий от Crazy_Doctor 25.11.08 23:50:48 MSK

Здесь я полностью согласен с Вами - существуют реализации BLAS и FFTW для Cell и CUDA, написанные производителями железа. Если будут появляться вспомогательные библиотеки, то кто знает, как всё обернётся...

И Вам удачи!

VIT ★
(26.11.08 00:05:38 MSK)

Ответ на: комментарий от VIT 26.11.08 00:05:38 MSK

> Если будут появляться вспомогательные библиотеки, то кто знает, как всё обернётся...

Вот если будет поддерживаемый вендорами OpenCL, то можно переписываться. А Cuda, возможно, вообще будет отброшена в пользу OpenCL лет через пять. Если человечеству повезёт.

sv75 ★★★★★
(26.11.08 10:27:44 MSK)

А зацените-ка вот это - http://fastra.ua.ac.be/en/index.html ! Тоже такой себе суперкомпьютер персональный. На 4-х 9800GX2. Обошелся создателям где-то в $6000. На ряде задач уделывает настоящий суперкомпьютер CalcUA стоимостью более $1.000.000 ;)

Rolex ★★
(26.11.08 13:43:35 MSK)

Ответ на: комментарий от Rolex 26.11.08 13:43:35 MSK

...правда не Ъ, ибо под виндой.

Rolex ★★
(26.11.08 13:44:50 MSK)

Ссылка

А как оно в качестве крипто-ускорителя? Там можно и 32 бита использовать,
только не всегда параллельно.
Всё зависит от алгоритма и режима его использования.

А как оно в качестве ускорителя brute-force атак?

anonymous
(26.11.08 14:07:15 MSK)

Ответ на: комментарий от anonymous 26.11.08 14:07:15 MSK

> А как оно в качестве ускорителя brute-force атак?

Не шибко умный брутфорс (который не тянет на докторскую) параллелится линейно чуть ли не на любое число процессоров. Так что смысл есть, надо только чтобы алгоритм проверки работал на одном видюшном ядре не сильно хуже, чем на цпу.

const86 ★★★★★
(26.11.08 14:39:12 MSK)

Ссылка

Ответ на: комментарий от sv75 26.11.08 10:27:44 MSK

> Вот если будет поддерживаемый вендорами OpenCL, то можно переписываться. А Cuda, возможно, вообще будет отброшена в пользу OpenCL лет через пять. Если человечеству повезёт.

Поймите, никто ничего не будет переписывать даже если будет обещаться ускорение в 100 раз. Здесь речь не идёт про BLAS/Lapack/FFTW/HDF5/NetCDF/p3dfft/mummps/hypre/spooles и прочие *вспомогательные* библиотеки программ. Они не переписываются, а портируются, поскольку их дизайн предусматривает подключение новых архитектур. Здесь речь идёт про пользовательские приложения, такие как NAMD/QBOX/CPMD/Gromax/Amber/StarCD/Fluent/Nek/CCSM/GPAW. Чтобы быть портированными, они должны быть "просто перекомпилированы и слинкованы с новыми библиотеками", или иначе они портированы просто не будут. Никому из пользователей этих приложений и знать не нужно (да они про них и не знают) про какие-то OpenCL или Cuda.

Вопрос, кто будет портировать вспомогательные библиотеки - открытый. Простые вещи, как-то BLAS, обычно портируют производители железа. А вот, например, как быть с hypre? Кто будет платить 3-4 месяца full-time специалисту высочайшего класса просто за порт? Вы вообще представляете себе масштаб затрат, а также риск, связанный, например, с изменением API через полгода? А если этот специалист уйдёт, кто будет осуществлять поддержку? А если он уйдёт не закончив? Найдёте замену? Много знаете специалистов, способных разобраться в коде hypre?

Резюме: такого рода проекты не "переписываются" просто так - это планомерный бизнес процесс с внимательным изучением и тщательным планированием перспектив, затрат, рисков. Обычно он начинается до того, как появляется железо в открытой продаже.

VIT ★
(26.11.08 16:55:12 MSK)

Ответ на: комментарий от VIT 26.11.08 16:55:12 MSK

> Здесь речь идёт про пользовательские приложения, такие как NAMD/QBOX/CPMD/Gromax/Amber/StarCD/Fluent/Nek/CCSM/GPAW. NAMD пишется в том же вузе, что первый ввёл cuda в учебный курс, итого: http://www.ks.uiuc.edu/Research/vmd/cuda/

sv75 ★★★★★
(26.11.08 17:58:39 MSK)

Ответ на: комментарий от sv75 26.11.08 17:58:39 MSK

> NAMD пишется в том же вузе, что первый ввёл cuda в учебный курс, итого: http://www.ks.uiuc.edu/Research/vmd/cuda/

НАМД уже давно не пишется, а "расширяется необходимыми потенциалами". Это уже давно не проект одного ВУЗа.

Моделирование классической молекулярной динамики и просмотрщик структур - две большие разницы, Вы и сами это понимаете. Люди вбухали деньги в кластер на GPU, всю жизнь занимаются классической MD, почему бы и не написать. Просмотрщиков, кстати, у каждой исследовательской группы по паре. У нас активно пользуют Paraview. Кстати, про этот VMD вопрос не далее как неделю назад вставал - один из пользователей хотел его погонять у нас на кластере. Видимо - судьба...

P.S. Про другие проекты чего нибудь скажете? ;)

VIT ★
(26.11.08 18:34:10 MSK)

<уровень шума < 45dbA.

Уга, уга, у-га-га! :D

anonymous
(26.11.08 18:52:03 MSK)

Ссылка

Ответ на: комментарий от VIT 26.11.08 18:34:10 MSK

> P.S. Про другие проекты чего нибудь скажете? ;)

Да я и про этот узнал от вас, не моя эта область (да и проект несвободный). Но учитывая, что за пределами Урбаны CUDA не сильно любят, думаю, что по остальным глухо.

Лично я раздумываю, а не перетащить ли на Cuda или OpenCL несколько лабов по паре курсов (ПВ у прикладных математиков и ПВ или моделиование на нашей кафедре), да и то если один-два ящика типа обсуждаемого NVidia подарит вузу. Вот и вся моя более чем скромная задача.

sv75 ★★★★★
(26.11.08 18:55:54 MSK)

Ответ на: комментарий от sv75 26.11.08 18:55:54 MSK

> Лично я раздумываю, а не перетащить ли на Cuda или OpenCL несколько лабов по паре курсов

Вот это дело хорошее! Ещё лучше, если каждую лабу студенты сделают дважды - на CUDA и на традиционной архитектуре, причем у Вас должна быть такая рабочая реализация CUDA, чтобы она уделывала традиционную раз так в 10. Тогда они к Вам потянутся ;).

Успехов!

VIT ★
(26.11.08 19:19:12 MSK)

Ответ на: комментарий от VIT 26.11.08 19:19:12 MSK

> причем у Вас должна быть такая рабочая реализация CUDA, чтобы она уделывала традиционную раз так в 10

Несложно найти такую традиционную, которую cuda уделает в 10 раз ;)

На моём компе нвидевский пример nbody выжимает 200 Gflops из видюхи (9800GT), а из проца (C2D E8500) выжимается 40 умножалкой матриц. Удивительное рядом :)

const86 ★★★★★
(26.11.08 22:49:41 MSK)

Ответ на: комментарий от const86 26.11.08 22:49:41 MSK

> Несложно найти такую традиционную, которую cuda уделает в 10 раз ;)

> На моём компе нвидевский пример nbody выжимает 200 Gflops из видюхи (9800GT), а из проца (C2D E8500) выжимается 40 умножалкой матриц. Удивительное рядом :)

Пример то найти не сложно, да вот только хороший студент попросит исходники глянуть. У Вас есть исходники dgemm для Cuda? Если мне не изменяет память, Nvidia не распространяет BLAS-src.

VIT ★
(27.11.08 00:04:49 MSK)

Ответ на: комментарий от VIT 27.11.08 00:04:49 MSK

> Если мне не изменяет память, Nvidia не распространяет BLAS-src.

Так у них и BLAS без сурсов? OMG. А может лучше это на кафедру прикладной математики или математической физики тогда, а не на кафедры ПО ? :)

sv75 ★★★★★
(27.11.08 11:30:50 MSK)

Ответ на: комментарий от sv75 27.11.08 11:30:50 MSK

> А может лучше это на кафедру прикладной математики или математической физики тогда, а не на кафедры ПО ? :)

- Доктор, я буду жить?

- А смысл?

;)

VIT ★
(27.11.08 17:49:14 MSK)

Ссылка

Ответ на: комментарий от Stalin 25.11.08 17:55:36 MSK

Кстати на счет ClearSpeed - http://www.ixbt.com/news/all/index.shtml?10/63/59. :)

anonymous
(27.11.08 21:27:36 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 3 →

←	Встреча пользователей Moscow MySQL User Group

Кластеры

Как быть хорошим (и ленивым) сисадмином

→

Похожие темы