LINUX.ORG.RU

NVIDIA CUDA 3.1

 , , ,


0

0

27-го июня компания NVIDIA выпустила очередную версию технологии CUDA. Из нововведений версии 3.1 отмечается следующее:

  • технология GPUDirect™ для прямого доступа к памяти GPU;
  • одновременное выполнение вплоть до 16 функций-ядер (только для архитектуры Fermi);
  • возможность одновременного использования CUDA Driver API и CUDA Runtime API, реализованная за счет разделяемых буферов;
  • нововведения, касающиеся языка CUDA C/C++:
    • возможность использования printf() в GPU-коде;
    • поддержка рекурсии и указателей на функции (только для архитектуры Fermi), что должно способствовать портированию программного кода на Fermi GPU;
  • унифицированный визуальный профайлер для CUDA и OpenCL;
  • множество улучшений в математических библиотеках CUBLAS и CUFFT;
  • новые примеры кода в составе SDK.

CUDA — программная технология, дающая возможность программистам на С/С++ использовать вычислительные мощности GPGPU наиболее естественным образом. До появления CUDA программистам приходилось пользоваться не самыми подходящими для вычислительных задач API OpenGL или Direct3D, загружая данные в GPU виде графических текстур и программируя алгоритмы на шейдерных языках. CUDA же представляет собой набор расширений для привычного языка C, автоматически заботясь о компиляции кода и его загрузке в GPU. Существуют аналогичная технология разработки AMD, FireStream, и попытка унификации GPGPU API — OpenCL. Последний в полной мере поддерживается технологией CUDA.

Программистам, использующим CUDA, рекомендуется воспользоваться специальными драйверами для разработчиков (доступными по нижеприведенной ссылке), которые поддерживают более широкий спектр устройств в меньшем объеме инсталлятора. Поддержка CUDA 3.1 обеспечивается драйверами серии 256.

>>> Подробности

★★

Проверено: Shaman007 ()

...Fermi...Fermi...Fermi...

И где теперь мои 8800, купленные специально из-за CUDA... :(

З.Ы.: Хотя заказывая точно понимал, что через годит уже устареют по самое немогу.

AlexVR ★★★★★
()
Ответ на: комментарий от post-factum

> А для интеловских видях есть такое?

Для нищебродскихконсьюмерских Intel GMA - нет, и не будет. Одно время Intel разрабатывал более продвинутую архитектуру Larrabee, но планы по ее использованию в качестве начинки для high-end видеокарт были благополучно похоронены. Ползут слухи, Intel все же собрирается выпустить Larrabee в качестве платформы для HPC и исследований в области компьютерной графики.

Вот там точно будет OpenCL.

Kuka ★★
() автор топика

> NVIDIA CUDA
глокая куздра?

tr0ll
()

>возможность использования printf() в GPU-коде
Только сейчас начали появляться возможности для отладки?

anon_666
()
Ответ на: комментарий от anon_666

был и до этого отладчик, профайлер и эмулятор

note173 ★★★★★
()
Ответ на: комментарий от nexus86

> когда можно ждать реальных приложений?

Реальных приложений? Если что, CUDA уже несколько лет как с комфортом прописалась в науке, где с ее помощью решаются задачи реальней некуда. Быть может, вы хотели сказать "быдлоконсьюмерских приложений"? Вас послушать, так рядового пользователя хлебом не корми, а дай посчитать гидро/газодинамику в круглосуточном режиме.

Впрочем, исключения есть. Например, физический движок NVIDIA PhysX, используемый в десятках игр, использует CUDA. Также есть шансы в скором времени увидеть использующий CUDA открытый кодировщик H.264. Но имейте в виду, что GPGPU - все же специализированный (несмотря на первые «GP») векторный процессор, и задачи, им решаемые, в подавляющем большинстве своем бесконечно далеки от десктопа.

Kuka ★★
() автор топика
Ответ на: комментарий от Kuka

графический редактор, блендер - вполне реальные приложения, которым бы пригодилось распараллеленое ускорение
хотя с блендером вроде можно использовать внешний трассировщик лучей на cuda, который показывает почти в реальном времени (для 3д макс точно можно)

note173 ★★★★★
()
Ответ на: комментарий от Kuka

> Вас послушать, так рядового пользователя хлебом не корми, а дай посчитать гидро/газодинамику в круглосуточном режиме.

А чем кормят гентушников?

ps. Кстати, респект. Я так посмотрел, вы тут единственный ньюсмейкер остались на весь лор, который пишет полезные качественные новости.

b_b_b
()
Ответ на: комментарий от note173

> графический редактор, блендер - вполне реальные приложения

Пожалуй, тут вы правы. Есть надежда, что с переходом на GEGL у гимповцев будет больше шансов (за счет более правильной архитектуры) реализовать некоторые операции на CUDA/OpenCL. Также могут выиграть приложения класса DAW (например, Ardour) и сэмплеры (навроде LinuxSampler) - операции над звуком, как правило, хорошо распараллеливаются.

А к Blender'у, таки да, прикручивается немалое количество внешних рендереров, поддерживающих интерфейс RenderMan - среди них точно есть распараллеливающиеся через MPI, и, вероятно, CUDA-enabled тоже найдутся.

Kuka ★★
() автор топика
Ответ на: комментарий от b_b_b

> А чем кормят гентушников?

Гентушников кормят, пардон, их собственными репродуктивными органами. GPGPU не предназначены для решения задач компиляции. GPGPU предназначены для «числодробилки» (в данном случае - арифметических действий с большим количеством данных).

ps. Кстати, респект. Я так посмотрел, вы тут единственный ньюсмейкер остались на весь лор


Благодарю. И уверяю вас, что ситуация с ньюсмейкерством все же не такая фатальная, как может показаться. Я склоняюсь к мнению, что это традиционное летнее затишье, а не результат не самой удачной новостной политики модераторов ресурса.

Kuka ★★
() автор топика

Говно какое-то. Чота не прёт меня из-за куды железку нвидии брать. Хотя конторка, конечно, солидная.

melkor217 ★★★★★
()
Ответ на: комментарий от note173

> не, они писали (GEGL), что не будет никаких cuda и opencl'ов

А вот это очень зря. Я сам знаю фотожоперов, которые иногда ждут по часу, пока у них гигантское изображение повернется на долю градуса. Тут как раз можно было бы им утереть нос. А про распараллеливание на CPU cores гегловцы ничего не писали, не помните?

Kuka ★★
() автор топика
Ответ на: комментарий от Kuka

фотошоп уже умеет использовать OpenGL для рисования (лимит в 6 открытых файлов с ускорением)

note173 ★★★★★
()
Ответ на: комментарий от note173

> в прошлом GSoC что-то было про GEGL и OpenGL

фотошоп уже умеет использовать OpenGL для рисования


Тут у вас путаница. OpenGL - API для 3D-визуализации, его уже освоили все кому не лень, а OpenCL - для параллельных вычислений на GPU, это как раз относительно свежая тема.

Kuka ★★
() автор топика
Ответ на: комментарий от Kuka

знаю)
OpenGL недавно тоже пытались применять для чистых вычислений на шейдерах, но я не об этом, а о применении GPU не по назначению в приложениях вообще

note173 ★★★★★
()
Ответ на: комментарий от wlan
eix -c cuda
[N] dev-python/pycuda ((~)0.93): Python wrapper for NVIDIA CUDA
[N] dev-util/nvidia-cuda-profiler ((~)1.1): NVIDIA CUDA Visual Profiler
[N] dev-util/nvidia-cuda-sdk ((~)3.0): NVIDIA CUDA Software Development Kit
[N] dev-util/nvidia-cuda-toolkit ((~)3.0): NVIDIA CUDA Toolkit
blessed
()
Ответ на: комментарий от blessed

кхе, спасибо, чото не догадался в пакетном менеджере глянуть

wlan ★★
()

Это наверное прикол такой айбиэмостроителей, заложенный полстолетия назад. Это надо было придумать модульную систему железок, чтоб на видюхах отдельная видеопамять была, чтобы в итоге... ну а теперь вот у меня в матери видюха, сетевуха, звучёк на борту, и все контроллеры. Ну чем блин не «амига»? Верно, клавиатура не распаяна на той же плате! А у дискретных железок давайте прямой доступ к памяти, чтоб как простая рама была. Вот так обосрали все задумки модульности.

trueshell ★★★★★
()
Ответ на: комментарий от Kuka

>А к Blender'у, таки да, прикручивается немалое количество внешних рендереров, поддерживающих интерфейс RenderMan - среди них точно есть распараллеливающиеся через MPI, и, вероятно, CUDA-enabled тоже найдутся.

Octane Render использует Cuda.
Luxrender же будет использовать OpenCL, уже есть работающий прототип SmallLuxGPU.

sid350 ★★★★★
()

Хорошая новость. Вон id Software со своим движком id Tech 6 смотрит в сторону CUDA и аналогичных технологий, так что и игрушки мимо не пройдут.

Zombieff ★★
()
Ответ на: комментарий от trueshell

trueshell> Это наверное прикол такой айбиэмостроителей, заложенный полстолетия назад. Это надо было придумать модульную систему железок, чтоб на видюхах отдельная видеопамять была, чтобы в итоге...

...а в итоге кто угодно может собрать себе PC, и нет завязки на одного производителя.

trueshell> ну а теперь вот у меня в матери видюха, сетевуха, звучёк на борту, и все контроллеры.

1. Видяха слабенькая.
2. Такая сетевуха подойдёт только для ограниченного круга задач, так как канал максимум гигабит сейчас на интегрированных сетевухах.
3. Звуковуха - самая пресамая задрипанная.
4. Не все. FireWire, например, до сих пор не во всех материнских платах.

Итог: такой джентльменский набор (из задрипанного и хиленького железа) встраивают только потому, что домашнему пользователю, не делающему ничего кроме просмотра кина, прослушивания музыки, пользования интернетом и подготовки документов (а также других нересурсоёмких задач) этого хватит за глаза. Остальным приходится докупать нормальные видеокарту, звуковую карту, сетевую карту, контроллеры и т.д. в зависимости от задач.
Просто интегрированное железо - это во-первых отличный рынок сбыта (отказаться от него нереально), а во-вторых при базовых требованиях к компьютеру так получается намного дешевле для ряда пользователей, а на фоне хорошего железа такое «удорожание» просто копейки.

Quasar ★★★★★
()
Ответ на: комментарий от starling13

CUDA 3.0 работает на Mandriva 2010.1 после правки nvcc.profile, с 3.1 скорее всего тоже самое. Там проблема не в дистрибутиве, а в gcc 4.4

Reset ★★★★★
()
Ответ на: комментарий от wlan

вообще работает, но отладкой лучше заниматься в студии

Reset ★★★★★
()
Ответ на: комментарий от b_b_b

>А чем кормят гентушников?

ради 5-10 минут 100% загрузки процессора в сутки юзать GPU? лол. постпроцессинг видео при просмотре больше на порядок жрёт

black7
()
Ответ на: комментарий от Kuka

> Вас послушать, так рядового пользователя хлебом не корми, а дай посчитать гидро/газодинамику в круглосуточном режиме.

Симуляция воды и дыма в Blender.

Evtomax
()
Ответ на: комментарий от bolmer

трололо Ферми - это только 470, 465, 480. Из них как карта более менее 470 остальное горячее прожорливое гавно, которое брать только ради куда - это быть идиотом.

anonymous
()
Ответ на: комментарий от Evtomax

Симуляция воды и дыма в играх :)

Не только это, любую физику вплоть до колыхания плаща на трехмерном челдобреке. Но:

  • не у всех стоит Nvidia для поддержки CUDA (что не нравится игроделам),
  • Куда и карточки меняются очень быстро (твое готовое решение уже устарело и может быть реализовано быстрее и подругому)
  • есть конечно OpenCL, но
    • его реализация пока желает лучшего (конечно реализуют, но все как то вяло).
    • производительность на тех же nvidia ниже чем у куды.
    • никто почти этому не учит (куде хотя бы учат в некоторых вузах, пусть и при небольшой но поддержке самой Nvidia).
    • не изменится ли кардинально через годик?

Хотя в целом тенденция положительная, и через пару лет игры без CUDA/PhysX/OpenCL/т.п. будут казаться полным отстоем. Но нужно еще воспитать соответствующих быдлокодеров :)

AlexVR ★★★★★
()
Ответ на: комментарий от Kuka

>Одно время Intel разрабатывал более продвинутую архитектуру Larrabee, но планы по ее использованию в качестве начинки для high-end видеокарт были благополучно похоронены. Ползут слухи, Intel все же собрирается выпустить Larrabee в качестве платформы для HPC и исследований в области компьютерной графики.

Источник тот еще, но: http://www.overclockers.ru/hardnews/37719/Intel_sravnila_bystrodejstvie_Core_...

Для Ъ: 32ядерные интеловские «ускорители вычислений» должны начать распространяться уже в этом году.

anonymous
()
Ответ на: комментарий от AlexVR

>не изменится ли кардинально через годик?

Например, куда? Унифицированный стандарт пока только один, к счастью. Разве что он возьмет и сдохнет, и останется зоопарк cuda/stream/как-там-интел-назовется.

anonymous
()
Ответ на: комментарий от anonymous

Источник тот еще, но: http://www.overclockers.ru/hardnews/37719/Intel_sravnila_bystrodejstvie_Core_...

Intel сравнила быстродействие Core i7-960 и GeForce GTX 280 в вычислениях

Пресловутое сравнение, где сравнили топовый процессор с нетоповой видюхой :) вот еще ссылка по теме

AlexVR ★★★★★
()
Ответ на: комментарий от anonymous

> Из них как карта более менее 470 остальное горячее прожорливое гавно

У меня 480-я нвидия работает тише боксового кулера от Core i7 980X даже на играх. Вытаскивайте руки из жопы, покупайте норм. корпруса.

bolmer
()
Ответ на: комментарий от AlexVR

> где сравнили топовый процессор с нетоповой видюхой :

Топовый процессор сейчас - это Inetel Core i7 980X. 6 ядер, более, чем в полтора с лишним раза быстрее 960-го.

bolmer
()
Ответ на: комментарий от AlexVR

> Куда и карточки меняются очень быстро

Ты путаешь геймерские карточки, на которых с CUDA работают только красноглазики, с профессиональными. Линейки последних устаревают гораздо медленнее.

bolmer
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.