LINUX.ORG.RU

NVidia тестирует видеодрайвер с поддержкой OpenCL

 , ,


0

0

Появилась на свет первая версия видеодрайвера от NVidia с поддержкой OpenCL. На текущий момент скачать драйвер можно только после регистрации на developer.nvidia.com.

OpenCL - фреймворк для создания приложений, связанных с паралельными вычислениях на различных GPU и CPU. Спецификации OpenCL были выработаны консорциумом Khronos Group в целях избежания разрождавшегося зоопарка GPGPU API (e.g. ATi Stream SDK, NVidia CUDA и др.)

>>> Подробности

Круто! А когда этот OpenCL будет что-то другое поддерживать?

Mihai-gr
()
Ответ на: комментарий от timur_dav

> Да и по ссылкам пока ничего внятного.

Есть контора нвидия, она выпускает карточки, годные не только для игр, но для вычислений. Есть NVidia CUDA - фреймворк для реализации вычислений на этих картах.

Есть ATi. У неё всё аналогично, но фреймворк свой, со своим ЯП. ATi Stream называется.

И тем, и другим, и третим фреймворком мало кто пользуется и никто не пользуется одновременно - слижком тяжело писать ПО под зоопарк. Поэтому сделали унифицированный openCL.

По ссылке подробности новости.
По первой ссылке - форма регистрации для тех, кто хочет скачать первый драйвер с OpenCL официально.

shahid ★★★★★
() автор топика

В последнее время чем свежее версия, тем тормознее. Всё меньше fps, всё медленнее работает. Аж противно. Карточка у меня стара как мир GeForce 6600, давно бы перестал обновляться, да вот в версии 177 kde безбожно глючит почему-то.

И ещё и новые ядра плохо поддерживаются старыми дровами NVIDIA.

Надо будет купить видеоплату поновее и посмотреть, как она с новыми дровами таки дружит.

Flaming ★★
()

[:||||||||:]

уже пару месяцев как скачать можно после регистрации

Reset ★★★★★
()
Ответ на: комментарий от Flaming

>Карточка у меня стара как мир GeForce 6600, давно бы перестал обновляться, да вот в версии 177 kde безбожно глючит почему-то.

Может потому, что для 6xxx есть legacy-ветка?

ist76 ★★★★★
()
Ответ на: комментарий от ist76

>Может потому, что для 6xxx есть legacy-ветка?

нет, 177 дрова + кеды безбожно глючили на всех карточках, что было исправлено в 180 ветке

Klayman
()
Ответ на: комментарий от shahid

> слижком тяжело писать ПО под зоопарк. Поэтому сделали унифицированный openCL.

Так это CUDA-капец?

Или же OpenCL в реализации nVidia работает ПОВЕРХ CUDA?

hobbit ★★★★★
()
Ответ на: комментарий от sid350

> ати не осилит, а если и осилит, то только по своим особым стандартам

Они вообще-то раньше нвидии осилили. Технология называется AMD Stream и существует уже год как, вроде бы..

RaySlava
()
Ответ на: комментарий от RaySlava

>Они вообще-то раньше нвидии осилили.
тут речь про OpenCL. И если судить по тому как Ати осиливает OpenGL, то с OpenCL тоже могут быть проблемы.

Bad_ptr ★★★★★
()
Ответ на: комментарий от hobbit

>Так это CUDA-капец?
ну и хорошо :-))
>Или же OpenCL в реализации nVidia работает ПОВЕРХ CUDA?

а какая разница? Если оно будет входить в драйвер, а писать надо будет на OpenCL.

Bad_ptr ★★★★★
()
Ответ на: комментарий от RaySlava

> Они вообще-то раньше нвидии осилили. Технология называется AMD Stream и существует уже год как, вроде бы..

бугага, всего лишь год ... а сколько cuda существует тебе напомнить? Тем более stream этот нестандартизирован в отличие от opencl

Reset ★★★★★
()

>тут речь про OpenCL. И если судить по тому как Ати осиливает OpenGL, то с OpenCL тоже могут быть проблемы.

они не могут быть, они всенепременно будут, а решить их удастся в следующем поколении, когда будем сидеть и пердеть своим внукам, что

>были времена внучок когда сидели перед ящиками и стучали по кнопочкам времена прошли а кактус остался

пс а накой там регистрация сделана? с какой целью

psionik
()
Ответ на: комментарий от ist76

> Может потому, что для 6xxx есть legacy-ветка?

нет, 6600 ещё входит в основную

overmind@darkstar ~/ $ glxgears
Running synchronized to the vertical refresh. The framerate should be
approximately 1/17949 the monitor refresh rate.
11611 frames in 5.0 seconds = 2322.190 FPS
13270 frames in 5.0 seconds = 2653.409 FPS
10482 frames in 5.0 seconds = 2095.302 FPS
15010 frames in 5.0 seconds = 3000.127 FPS
^C


арчлинукс, kde4 с включенным композитом, nvidia 180.51, 02:00.0 VGA compatible controller: nVidia Corporation NV43 [GeForce 6600] (rev a2)

overmind88 ★★★★★
()
Ответ на: комментарий от ist76

Нет, 6xxx на всех версиях работает. Эта серия пока не legacy. Просто плохо работает. Наверное, так со всеми карточками...

А вообще мне пофик, какую версию ставить, хоть самую древнюю. Лишь бы работало. Но на 2.6.30-м ядре работает только 180-185.

Flaming ★★
()
Ответ на: комментарий от overmind88

o_O А 180.51 я не пробовал.

P.S. у меня ~1200 fps. Прямо не понимаю...

P.P.S. Сейчас поставил 180.29, откатил ради этого ядро даже.

Flaming ★★
()
Ответ на: комментарий от hobbit

Именно так, поверх CUDA. По идее, и у ATi он должен будет работать поверх их соответствующей технологии, так и ликвидируется зоопарк.

rexadecimal
()
Ответ на: комментарий от rexadecimal

да просто напросто следующее поколение видеокарт будет иметь внутри себя OpenCL нативно а не поверх. В данный момент эта прослоечность необходима для унификации. Начало хорошее, лишь бы прижилось.

Ras
()
Ответ на: комментарий от graynder

> Ребята которые разработали форму для регистрации - фанаты журнала "Хочу все знать"

Мало того, данные в форме проверяются людьми, а не автоматически парсятся сервером.

shahid ★★★★★
() автор топика
Ответ на: комментарий от Reset

> бугага, всего лишь год ... а сколько cuda существует тебе напомнить? Тем более stream этот нестандартизирован в отличие от opencl

напомните, пожалуйста, если вас не затруднит :)

Всю жизнь пользуюсь ati, поэтому про нвидию могу что-то не знать...

RaySlava
()

Для повышения кругозора озвучьте пожалуйста хоть один API из др.

Barlog_M
()
Ответ на: комментарий от elipse



http://www.ixbt.com/news/all/index.shtml?11/40/88
Среда, 10 Декабря, 2008

Организация Khronos Group, одним из основателей и активным членом которой является компания AMD, утвердила стандарт OpenCL 1.0. Этот стандарт даст в руки разработчикам программного обеспечения универсальный механизм использования вычислительного ресурса современных GPU, как процессоров общего назначения (GPGPU). Выработку спецификаций OpenCL поддержали IBM, Intel, ARM, Motorola и другие компании, в том числе, специализирующиеся на создании компьютерных игр.

Как и было обещано, компания AMD объявила о намерении в сжатые сроки интегрировать компилятор, поддерживающий стандарт OpenCL 1.0, и соответствующую библиотеку времени исполнения в бесплатно распространяемый набор разработчика ATI Stream Software Development Kit (SDK). По словам AMD, выход ATI Stream SDK с поддержкой OpenCL 1.0 состоится в первой половине будущего года.

Напомним, ATI Stream представляет собой комбинацию аппаратных и программных технологий, позволяющих задействовать графические процессоры AMD для ускорения приложений, традиционно возлагаемых на центральный процессор.

elipse ★★★
()

Блин, ну когда уже эта волна неистового восхищения схлынет, и люди прозреют, что OpenCL - это ненужный костыль.

ИМХО, надо не мощность видеокарты использовать для вычислений, а наоборот - использовать ядро процессора для рендеринга. Вообще, хватит уже плодить устройства - надо всю вычислительную мощность концентрировать в одном "ядре" (суперскалярном, разумеется) - это позволит более рационально распределять её для различных задач - и для научных расчетов, и для рендеринга 3D.

Nixopatolog
()
Ответ на: комментарий от Nixopatolog

>надо не мощность видеокарты использовать для вычислений, а наоборот - использовать ядро процессора для рендеринга

Здравствуй i386 и первый дум с тормозами? Это уже проходили.

DrMoriarty
()
Ответ на: комментарий от DrMoriarty

Нет, здравствуй cpu с 100 или 200 ядрами архитектуры arm или mips, или более подходящих разработок. Фактически получится нечто вроде нынешних видеокарт, с чуть более универсальными процессорами, но зато уже не будет деления на cpu и gpu. Использование процессоров разных архитектур в одной программе - серьёзно усложняет написание кода. Хотелось бы не только кодеки распаралеливать, но и всё что можно запрограммировать. А перераспределять нагрузку gpu<->cpu когда они имеют разные архитектуры - это сильно усложнение, хотя бы драйверой части.

ixrws ★★★
()
Ответ на: комментарий от ixrws

>Нет, здравствуй cpu с 100 или 200 ядрами архитектуры arm или mips, или более подходящих разработок

И как это противоречит OpenCL? Там фишка как раз в том, что иекст программы на ходу компилируется в код для конкретной железяки, и исполняется на всём, что может считать.

adarovsky ★★★★
()
Ответ на: комментарий от ixrws

> архитектуры arm или mips

Про mips ничего не скажу, а вот что хорошего в arm, кроме того, что они меделенные как незнамо что ? 100 ядерный pentium2-200Mhz представляешь себе? Да его восьмиядерная корка порвет как тузик грелку.

Reset ★★★★★
()

Очень все хочу понять, но не могу, мешает странная конструкция "разрождавшегося". Что это за слово, блин горелый, объясните!

Shtucer
()
Ответ на: комментарий от elipse

Это нечто, что существует только на бумаге. Да и думаю чуда не произойдет, и чтобы оценить производительность по сравнению с intel'ями надо будет, как обычно, частоту arm'а разделить на 4.

В общем не может процессор для сотовых телефонов быть тем самым универсальным процессором на котором можно и 3d рендерить и все остальное делать.

Reset ★★★★★
()
Ответ на: комментарий от Reset

Ну вы прям раз уж такой умный, то скажите ка, а мощьность шейдерных процессоров в gpu очень велика? При паралельных вычислениях это почти что не важно, важно количество вычислительных блоков и подходящее устройство блоков. В случае арм это делается как два пальца об. А в случае интеля - интель уже начал продавать лицензии чипмейкерам на корки? - Тотоже.

Кроме того, последние армы, используемые допустим в snapdragon они уже не на бумаге, прикиньте ка мощьность 100-ядерника такого.

ixrws ★★★
()
Ответ на: комментарий от Nixopatolog

>ИМХО, надо не мощность видеокарты использовать для вычислений, а наоборот - использовать ядро процессора для рендеринга.
Плюсадин! Видеокарта не должна заниматься вычислениями.

К счастью, и интел и амд уже опомнились и занимаются чем-то вроде этого.

eugene2k
()
Ответ на: комментарий от DrMoriarty

> Здравствуй i386 и первый дум с тормозами? Это уже проходили.

С тех пор процессоры слегка изменились. А некоторые алгоритмы, например, raytrace хорошо паралелятся. По идее, процессор уровня Core 2, но с 16 ядрами уже сможет делать raytrace в реальном времени.

atrus ★★★★★
()
Ответ на: комментарий от Flaming

у меня на 6100 на ноуте с композитом в кедах 1200, без 1800, но тормозов не замечено, даже в игрульках под вайном (некоторые правда приводят к отрубанию композита за нехваткой ресурсов), так что попугаи не показатель

PayableOnDeath
()
Ответ на: комментарий от DrMoriarty

согласен, процессоры с common набором команд очень сильно проигрывают поддерживающим только перемножение матриц в этом деле

PayableOnDeath
()
Ответ на: комментарий от atrus

сказать просто, а сделать нет, иначе давно были бы такие предложения на рынке, тут идеи простые, академики не нужны, чтобы сообразить

PayableOnDeath
()
Ответ на: комментарий от PayableOnDeath

> сказать просто, а сделать нет, иначе давно были бы такие предложения на рынке, тут идеи простые, академики не нужны, чтобы сообразить

Читайте: http://blogs.intel.com/research/2007/10/real_time_raytracing_the_end_o.php

Даже M$ почти уговорили включить опцию рейтрейсера в DirectX 11: http://tech.slashdot.org/article.pl?sid=08/03/31/1423247
Но в последний момент они испугались и отменили всё: http://news.softpedia.com/news/Bad-News-for-Intel-DirectX-11-Doesn-039-t-Do-R...

Впрочем, это ничего не значит. То, что такой вариант рассматривался - значит, что железо практически готово. Если не сейчас, то появится в DirectX 12 или начнут добавлять расширения в OpenGL...

atrus ★★★★★
()
Ответ на: комментарий от PayableOnDeath

> только причём здесь MS

При том, что нравится вам или нет, но M$ - один из крупнейших разработчиков ПО, в том числе и связанного с разработкой игр. Разработчик одного из двух популярнейших API и библиотеки, реализующей его. И если их удалось уговорить включить рейтрейсинг в следующую версию, пусть даже потом они пошли на попятную, то это значит только одно - там было что включать.

А это в свою очередь уже показывает, что процессоры обозримого будущего, 8 и 16 ядерники, смогут тянуть рейтрейсинг в реальном времени.

atrus ★★★★★
()
Ответ на: комментарий от PayableOnDeath

У меня тормозов тоже не замечено... на дровах 180.29. Тормоза есть на более поздних дровах. Но на 180.29 не работает 30-е ядро. :(

А я композит всегда вручную отключаю перед тяжеловесными игрушками. Подумываю, может, и кеды выгружать? :)

Flaming ★★
()
Ответ на: комментарий от atrus

>но с 16 ядрами уже сможет делать raytrace в реальном времени.

Да проблема в том, что в пямть там нехило упирается - посмотрите чего стоят затраты на синхронизацию доступа к памяти, в шину упроётесь. Нихрена не получить прирост в 16 раз, в 5 - это будет очень неплохой вариант. На видяхе всё очень бытсро считается, потому что там программы сильно урезаны не оперируют памятью целиком, а только маленькими кусочками, и это оптимизировать можно. "Общее назначение" не рулит ни разу.

theos ★★★
()
Ответ на: комментарий от ixrws

>Нет, здравствуй cpu с 100 или 200 ядрами архитектуры arm или mips

Специалисты такие специалисты...

theos ★★★
()
Ответ на: комментарий от sid350

> ати не осилит, а если и осилит, то только по своим особым стандартам

уже осилили. но не под линух

namezys ★★★★
()
Ответ на: комментарий от timur_dav

> Опять либо только новые будут карты поддерживать?

все, который удовлетворяют минимальным требованиям

namezys ★★★★
()
Ответ на: комментарий от Flaming

> Карточка у меня стара как мир GeForce 6600

по моему тебе тогда это не актуально

namezys ★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.