NVIDIA CUDA 4.0 и CUDA-GDB

0

1

Состоялся релиз NVIDIA CUDA 4.0. Также можно отметить релиз CUDA-GDB. Далее - текст из официальной русскоязычной новости.

Набор инструментов NVIDIA CUDA 4.0 был создан, чтобы упростить параллельное программирование и позволить еще более широкому кругу разработчиков портировать свои приложения на GPU. Основные возможности новой архитектуры:

Технология NVIDIA GPUDirect™ 2.0 обеспечивает равноправную связь между GPU в рамках одного сервера или рабочей станции, что упрощает и ускоряет мультипроцессорное программирование и работу приложений.
Унифицированная виртуальная адресация (UVA) организует единое адресное пространство для основной системной памяти и памяти GPU, что делает параллельное программирование еще быстрее и проще.
Библиотеки примитивов Thrust C++ - набор алгоритмов C++ с открытым кодом для параллельных расчетов и структур данных, которые упрощают программирование для разработчиков на C++. Thrust ускоряет стандартные операции, такие как параллельное хранение, в 5-100 раз по сравнению с библиотеками Standard Template Library (STL) и Threading Building Blocks (TBB).

Другие функции и возможности:

интеграция MPI с приложениями CUDA – Модификация MPI, например, OpenMPI, автоматически пересылает данные в память GPU и обратно по Infiniband, когда приложение посылает или получает запрос от MPI.
Многопоточность и GPU – Многочисленные потоки с CPU хоста могут обмениваться контекстом на одном GPU, что упрощает совместное использование GPU многопоточными приложениями.
Использование нескольких GPU одним потоком с CPU – Один поток с CPU хоста может иметь доступ ко всем GPU в системе. Разработчики могут легко распределить работу между несколькими GPU для таких задач, как обмен «ореолами» в приложениях.
Новая библиотека NPP для обработки изображений и компьютерного видения – Большой набор операций по трансформации изображения, которые позволяют быстро разрабатывать приложения обработки изображений и компьютерного зрения.

Новые и улучшенные возможности:

Автоматический анализ производительности в Visual Profiler
Новые функции в cuda-gdb и поддержка MacOS
Поддержка функций C++, таких как new/delete и виртуальные функции
Новый бинарный дизассемлер на GPU

Подробности о новых возможностях можно узнать на странице с русскоязычной новостью. В ней не сказано о том, что состоялся релиз, потому что в тот день существовал ещё только кандидат в релизы. Англоязычная новость, в свою очередь, объявляет релиз, гораздо короче (просто список терминов без разъяснений) и подробнее.

Русскоязычная новость

>>> Англоязычная новость о релизе

Ссылка

← Релиз Wireshark 1.6.0

В Kwin ведётся работа для поддержки Wayland-клиентов →

← 1 2 →

Замечательно,инвидя впереди планеты всей.

~~Ubuntu1104~~ ☆
(09.06.11 06:39:48 MSK)

Ответ на: комментарий от Ubuntu1104 09.06.11 06:39:48 MSK

Поэтому M$ и хочет ее прибарахлить

northerner ★★★
(09.06.11 09:11:27 MSK)

> Поддержка функций C++, таких как новый/удалить и виртуальные функции

новый/удалить

facepalm.jpg

EvilBlueBeaver ★
(09.06.11 09:11:37 MSK)

Ответ на: комментарий от northerner 09.06.11 09:11:27 MSK

Если «прибарахлит» - прощай хорошие видеокарты, прощай вычисления на GPU, привет тормозная 2D графика...

~~Eddy_Em~~ ☆☆☆☆☆
(09.06.11 09:23:27 MSK)

Ответ на: комментарий от EvilBlueBeaver 09.06.11 09:11:37 MSK

new/delete бы оставили...

nevar ★★
(09.06.11 09:25:34 MSK)

Ссылка

>Англоязычная новость, в свою очередь, объявляет релиз,
как-то коряво

и компьютерного зрения

что это? за нами следят?

insider ★★★
(09.06.11 09:26:00 MSK)

Ссылка

Ответ на: комментарий от Ubuntu1104 09.06.11 06:39:48 MSK

> инвидя впереди планеты всей.
То-то они частенько выпускают на рынок бракованные видеокарты. ОЙимд фо эвер.

~~Phaser~~
(09.06.11 09:29:10 MSK)

Поддержка функций C++, таких как новый/удалить

Google Translate? Или просто перевод человека, не знающего ничего о C++ и программировании вообще?

Deleted
(09.06.11 09:40:32 MSK)

Ссылка

Thrust ускоряет стандартные операции, такие как параллельное хранение, в 5-100 раз

Аффтар, если ты не программист, зачем пишешь новости о программировании? Первый пункт вообще шедевр, минуту читал эту бессмыслицу и соображал где ошибка: при чем здесь рабочие станции и сервера, GPU на видеокарте!

ненужно - OpenCL наше фсио!!!!!

anonymous
(09.06.11 10:13:29 MSK)

Ссылка

параллельное хранение

Это что?

vada ★★★★★
(09.06.11 10:17:15 MSK)

Поддержка функций C++, таких как новый/удалить

#подключить <строка>
#подключить <ДругойКласс.h>
//-----------------------------------------------------
Класс
{
личный:
 ДругойКласс* другойКласс;
защищённый:
открытый:
 Класс(стнд:строка надпись)
 {
  другойКласс = новый ДругойКласс(надпись);
  возврат;
 }
 ~Класс(пустой)
 {
  удалить другойКласс;
  возврат;
 }
};
//--------------------------------------------------------
целое главная(целое аргкол,символ** аргвект)
{
 Класс класс("Убейте переводчика!!!");
 возврат 0;
}

one_more_hokum ★★★
(09.06.11 10:18:16 MSK)

> параллельное хранение
facepalm.pcx.gz

x4DA ★★★★★
(09.06.11 10:19:50 MSK)

Ссылка

Ответ на: комментарий от vada 09.06.11 10:17:15 MSK

IMHO, это parallel store operation

x4DA ★★★★★
(09.06.11 10:20:31 MSK)

Ответ на: комментарий от x4DA 09.06.11 10:20:31 MSK

Фу... Отпустило.

vada ★★★★★
(09.06.11 10:22:58 MSK)

Ссылка

Ответ на: комментарий от vada 09.06.11 10:17:15 MSK

This code sample computes the sum of 100 random numbers on the GPU.

#include <thrust/host_vector.h>
#include <thrust/device_vector.h>
#include <thrust/generate.h>
#include <thrust/reduce.h>
#include <thrust/functional.h>
#include <cstdlib>

int main(void)
{
  // generate random data on the host
  thrust::host_vector<int> h_vec(100);
  thrust::generate(h_vec.begin(), h_vec.end(), rand);

  // transfer to device and compute sum
  thrust::device_vector<int> d_vec = h_vec;
  int x = thrust::reduce(d_vec.begin(), d_vec.end(), 0, thrust::plus<int>());
  return 0;
}

x4DA ★★★★★
(09.06.11 10:23:39 MSK)

Ващета за такой текст новости надо ТС в бан на месяц и две серых звезды. Одна всего? В долг значит.

vada ★★★★★
(09.06.11 10:24:54 MSK)

Ссылка

Ответ на: комментарий от x4DA 09.06.11 10:23:39 MSK

Красиво!

vada ★★★★★
(09.06.11 10:26:58 MSK)

Ссылка

Ответ на: комментарий от x4DA 09.06.11 10:23:39 MSK

Это в куде такое появилось?? Твари, они украли мое изобретение, которое я года два назад сделал. Только у меня типы назывались array_host<...> и array_device<...>. Теперь кучу кода на помойку придется выкинуть.

Reset ★★★★★
(09.06.11 10:44:49 MSK)

Ответ на: комментарий от one_more_hokum 09.06.11 10:18:16 MSK

А ниче так =)

exst ★★★★★
(09.06.11 10:51:40 MSK)

Ссылка

поправьте перевод, глаза режут эти новый/удалить.

anonymous
(09.06.11 11:04:33 MSK)

Ответ на: комментарий от x4DA 09.06.11 10:23:39 MSK

Это что, куда так упростилась?

~~Eddy_Em~~ ☆☆☆☆☆
(09.06.11 11:13:23 MSK)

Ответ на: комментарий от Eddy_Em 09.06.11 11:13:23 MSK

А она когда-то была сложной?

AlexVR ★★★★★
(09.06.11 11:17:59 MSK)

Объясните, зачем нужна эта КУДА, если есть ОпенЦл? Это специально для буратин, которые хотят посильней попасть в vendor lock-in?

gaga ★
(09.06.11 11:20:30 MSK)

Ответ на: комментарий от AlexVR 09.06.11 11:17:59 MSK

Тьфу ты, понял: определение ядра и его вызов происходят в классе thrust...

~~Eddy_Em~~ ☆☆☆☆☆
(09.06.11 11:22:35 MSK)

Ссылка

Ответ на: комментарий от gaga 09.06.11 11:20:30 MSK

Толсто же.

~~Eddy_Em~~ ☆☆☆☆☆
(09.06.11 11:22:42 MSK)

Ответ на: комментарий от Eddy_Em 09.06.11 11:13:23 MSK

Ну это библиотека STL-like с поддержкой фич куды.

CUDA API - действительно, несложная вещь.

x4DA ★★★★★
(09.06.11 11:24:35 MSK)

Ответ на: комментарий от x4DA 09.06.11 11:24:35 MSK

CUDA API - действительно, несложная вещь.

Вот только любителям openCL этого не понять :)

~~Eddy_Em~~ ☆☆☆☆☆
(09.06.11 11:26:06 MSK)

Ответ на: комментарий от Eddy_Em 09.06.11 11:26:06 MSK

Вот только любителям openCL этого не понять :)

OpenCL - для массовых проектов на будущее.

CUDA - для тех кому надо считать сейчас и быстро.

AlexVR ★★★★★
(09.06.11 11:28:32 MSK)

Ответ на: комментарий от gaga 09.06.11 11:20:30 MSK

У меня возникает такой же вопрос.

Chaser_Andrey ★★★★★
(09.06.11 11:28:37 MSK)

Ссылка

Ответ на: комментарий от one_more_hokum 09.06.11 10:18:16 MSK

А что, по-моему, весьма симпатично! :)

Веет тёплой ламповостью, как от «АльфаДОС»!

Boboms ★★
(09.06.11 11:29:06 MSK)

Ответ на: комментарий от anonymous 09.06.11 11:04:33 MSK

Думаю, что поправлять не будут. До сих пор не поправили идиотизм вида «обратный инжиниринг».

Хорошо, что не «Колхозно-Тракторинг».

Boboms ★★
(09.06.11 11:31:06 MSK)

Ссылка

Ответ на: комментарий от Boboms 09.06.11 11:29:06 MSK

Вам что, 1С-а не хватает??? Писать программы «на русском языке» — это-ж страшный сон!

one_more_hokum ★★★
(09.06.11 11:31:47 MSK)

Ответ на: комментарий от one_more_hokum 09.06.11 11:31:47 MSK

Да нет, причём тут вообще этот долбанный 1С? Там чистой воды порнография, а у вас «в тексте» довольно прикольно и читабельно получилось.

Boboms ★★
(09.06.11 11:33:45 MSK)

Ответ на: комментарий от AlexVR 09.06.11 11:28:32 MSK

Если бы на openCL было писать так же просто, как на CUDA, то явно перевес был бы в сторону первого (а то и вообще nVidia куду бы не пилило).

~~Eddy_Em~~ ☆☆☆☆☆
(09.06.11 11:37:28 MSK)

Ссылка

Ответ на: комментарий от Eddy_Em 09.06.11 11:22:42 MSK

Да не толсто, я не занимаюсь программированием GPU и знаю о нем только по респектабельным научным статьям с лора и прочих слешдотов. И поскольку из них не сильно-то ясно, что в нем такого хорошего, что позволяет разработчику положить на половину существующих карточек, то и возникает такой вопрос.

gaga ★
(09.06.11 11:37:43 MSK)

Ответ на: комментарий от gaga 09.06.11 11:37:43 MSK

из них не сильно-то ясно, что в нем такого хорошего, что позволяет разработчику положить на половину существующих карточек

А я читал нормальные научные статьи. И ни разу не видел, чтобы кто-нибудь использовал openCL для быстрых вычислений. Используют CUDA.

А про

положить на половину существующих карточек

- все настолько привыкли, что ATI производит дерьмовые карточки, что когда карточки стали нормальными (если не врут), привычка все равно осталась. И недоверие.

И еще раз: код на openCL в разы объемнее и запутаннее кода на CUDA.

~~Eddy_Em~~ ☆☆☆☆☆
(09.06.11 11:42:37 MSK)

Ответ на: комментарий от Boboms 09.06.11 11:33:45 MSK

> довольно прикольно и читабельно получилось

Только вот не «писабельно». :-)

one_more_hokum ★★★
(09.06.11 11:43:51 MSK)

Ссылка

Ответ на: комментарий от Eddy_Em 09.06.11 09:23:27 MSK

> Если «прибарахлит» - прощай хорошие видеокарты, прощай вычисления на GPU, привет тормозная 2D графика...

А ATI/AMD не предоставляет альтернативы? В смысле интересно именно вычисления на GPU.

Evgueni ★★★★★
(09.06.11 11:55:09 MSK)

Ответ на: комментарий от Evgueni 09.06.11 11:55:09 MSK

Предоставляет, но я уже говорил: во-первых, openCL - жуткое уродливое нечто; во-вторых: притчу о пастухе-брехуне помните? Вот поэтому к ATI многие до сих пор относятся негативно.

~~Eddy_Em~~ ☆☆☆☆☆
(09.06.11 11:57:21 MSK)

Ссылка

С OpenCL ситуация пока неясная. С одной стороны вроде как и стандарт, а с другой стороны те, кто хотел написать код под гпу уже его написали на куде. Также я пока не видел вариантов ати для кластеров. Ибо например для того же крея делают блейда - материнская плата, на которой уже распаяна пара тесел.
Тот же IBM тоже обещал компилятор OpenCL под Cell. Но воз и ныне там. Правда intel разродилась компилятором под OpenCL для своих процов, но пока только виндовс.
Еще, когда то на сайте кроноса пробегала новость про OpenCL для армов. А также кто пилил транслятор VHDL в OpenCL (это для fpga).

Gromacs, namd, ansys & etc используют cuda.

b_a
(09.06.11 12:25:43 MSK)

Ответ на: комментарий от Evgueni 09.06.11 11:55:09 MSK

У ATI есть низкоуровневый ATI FireStream

x4DA ★★★★★
(09.06.11 12:29:07 MSK)

кто знает, какие есть опенсорс проекты на куде?!

Boy_from_Jungle ★★★★
(09.06.11 12:37:05 MSK)

Ответ на: комментарий от x4DA 09.06.11 12:29:07 MSK

Который однако забросили, насколько я знаю на данный момент основной язык программирования ATI карточек на данный момент это OpenCL

b_a
(09.06.11 12:40:17 MSK)

Ссылка

И каким боком это относится к линапсу?

startApp
(09.06.11 12:48:02 MSK)

Ссылка

Ответ на: комментарий от b_a 09.06.11 12:25:43 MSK

> транслятор VHDL в OpenCL (это для fpga).
или OpenCL в VHDL?

Gromacs, namd, ansys & etc используют cuda.

В ansys hfss, например, даже за ещё одно ядро цпу нужно выкладывать вроде бы астрономическую сумму. Сколько ж надо платить за возможность использования гпу?

Не всё ли это — пустой маркетинговый выхлоп, так как нвидиевские горячие «пирожки», с парой вычислительных блоков и over 9000 кэшей и шин, на самом деле (см. bitcoin) ни на что не годны?

wstorm ★★
(09.06.11 13:02:09 MSK)

Ответ на: комментарий от Eddy_Em 09.06.11 11:42:37 MSK

>код на openCL в разы объемнее и запутаннее кода на CUDA.
Блин, и почему открытые стандарты так часто оказываются повернутыми жопой к пользователю..

gaga ★
(09.06.11 13:05:27 MSK)