LINUX.ORG.RU
 
kranky

ATI Stream Software Development Kit (SDK) v2.2


0

0

Спустя 2 месяца после того, как Khronos Group выпустила спецификацию для OpenCL версии 1.1, поддержка данного стандарта появилась и в кроссплатформенной среде разработки от AMD - Stream SDK 2.2.

Кроме этого в новую версию добавлены:

  • Поддержка Ubuntu 10.04 и Red Hat Enterprise Linux 5.5
  • Поддержка процессоров с SSE2 и старше
  • Поддержка GCC 4.1 и старше
  • Создание и загрузка бинарных OpenCL-ядер

И многое другое.

ATI Stream SDK 2.2 доступен для скачивания с сайта developer.amd.com. Там же можно посмотреть документацию.

>>> Подробности


[#]  
annulen

а я-то думал что смысл OpenCL в отсутствие вендор-ангажированных средств разработки(

** ()
[#]  
unfo

Оно сильно хуже в плане возможностей/производительности по сравнению с кудой?

* ()
[#] Ответ на: комментарий от unfo 13.08.2010 20:04:05  
>>-----Цитата---->>

Оно сильно хуже в плане возможностей/производительности по сравнению с кудой?

<<-----Цитата----<<

Есть субъективное ощущение, что оно сильно неудобнее. В куде обещали едва ли не поддержку Питона. И всяко кроме гольного C/C++ там есть Фортран, что для математических рассчётов очень важно.

*** ()
[#] Ответ на: комментарий от annulen 13.08.2010 20:01:14  
note173

смысл OpenCL такой же, как у OpenGL

*** ()
[#] Ответ на: комментарий от Vudod 13.08.2010 20:16:01  
unfo

Про фортран не знал, спасибо. В сильных числодробилках вполне может пригодиться.

* ()
[#]  

Почему стрёмное то?

anonymous ()
[#] Ответ на: комментарий от unfo 13.08.2010 20:04:05  
axel92

> Оно сильно хуже в плане производительности по сравнению с кудой?

Сильно.

()
[#] Ответ на: комментарий от unfo 13.08.2010 20:04:05  
Reset

Сильно. Если нужна кроссплатформенность, то на куде надо писать и отлаживать, а потом портировать на OpenCL, да и то геморройно будет ибо в OpenCL нет многих вещей.

***** ()
[#] Ответ на: комментарий от unfo 13.08.2010 20:04:05  

>Оно сильно хуже в плане возможностей/производительности по сравнению с кудой?

Ничуть не хуже.

anonymous ()
[#]  

Все стандарты Хроноса просты и понятны для граждан созвездия Псов )0@0(

anonymous ()
[#] Ответ на: комментарий от anonymous 13.08.2010 20:37:40  

и кому верить? Пруфы в студию.

** ()
[#] Ответ на: комментарий от anonymous 13.08.2010 20:37:40  
axel92

Пруф? А то у меня другие данные.

()
[#] Ответ на: комментарий от anonymous 13.08.2010 20:37:40  

ололо, толстенький. ты сам-то пробовал их юзать или только по рекламным статейкам судишь ?

anonymous ()
[#] Ответ на: комментарий от Vudod 13.08.2010 20:16:01  
annulen

>И всяко кроме гольного C/C++ там есть Фортран, что для математических рассчётов очень важно.

слинковать фортранный код с С/С++ довольно просто

** ()
[#] Ответ на: комментарий от axel92 13.08.2010 20:42:06  
kranky

>Пруф? А то у меня другие данные.

Вот например. http://www.sisoftware.net/?d=qa&f=gpu_opencl&l=ru&a=
Плюс тесты не самые новые (на forceware 190.*), с тех пор пофиксили много проблем с производительностью. Кроме того, сдаётся мне, нвидиевский компилятор препроцессингом превращает опенцл-ядро в куда-ядро и потом компилирует, и разницы в скорости практически не будет.

А теперь давай пруфы твоих "других данных".

*** ()
[#] Ответ на: комментарий от unfo 13.08.2010 20:20:51  
annulen

> В сильных числодробилках вполне может пригодиться.

Для числодробилки вполне подойдет готовая GPU-ускоренная либа

** ()
[#]  

MinGW тоже добавили, и Виндовый компилятор 2010 тоже.

anonymous ()
[#] Ответ на: комментарий от kranky 13.08.2010 21:00:41  
axel92

а черт перепутал, я про stream и openCL думал, что за день сегодня такой...

()
[#] Ответ на: комментарий от annulen 13.08.2010 21:01:41  
unfo

К сожалению, не для всех задач есть готовые либы. А в фортране точность более, чем приличная.

* ()
[#] Ответ на: комментарий от kranky 13.08.2010 20:50:21  
Reset

Чего такое MPixel/s и как это перевести в гигафлопсы?

***** ()
[#]  

Работал и с кудой, и с opencl. Разница в производительности в пределах погрешности, по крайней мере на видюхах нвидии. Апи практически одинаковые, практически вся разница в названиях. И да, куча троллей в топике детектед. Особенно орущие про непонятный апи и тормознутость по сравнению с кудой. Они (эти тролли) не нужны.

anonymous ()
[#] Ответ на: комментарий от anonymous 13.08.2010 21:38:49  
note173

в тоже время, нельзя сказать, что апи такой уж понятный и очевидный
кому надо - разберутся без проблем, но порог вхождения таки есть

*** ()
[#] Ответ на: комментарий от note173 13.08.2010 21:42:42  

Порог вхождения есть, хотя бы потому, но он не больше, чем порог вхождения в ту же CUDA, и намного меньше, чем в DirectCompute.

anonymous ()
[#] Ответ на: комментарий от anonymous 13.08.2010 21:44:37  

s/ хотя бы потому,//

селффикс

anonymous ()
[#] Ответ на: комментарий от anonymous 13.08.2010 21:38:49  
unfo

>Работал и с кудой, и с opencl. Разница в производительности в пределах погрешности, по крайней мере на видюхах нвидии. Апи практически одинаковые, практически вся разница в названиях. И да, куча троллей в топике детектед. Особенно орущие про непонятный апи и тормознутость по сравнению с кудой. Они (эти тролли) не нужны.

Спасибо, добрый человек, за информацию.

* ()
[#] Ответ на: комментарий от Reset 13.08.2010 21:29:59  
kranky

>Чего такое MPixel/s

Чукча не читатель?

>>-----Цитата---->>

The arithmetic results are in pixels/s, i.e. how many pixels can be computed in 1 second. In all cases, as higher indexes mean better performance (pixels/s) the higher the result the better the performance. The memory results are in MB/s, i.e. how many MB can be transferred in 1 second. In all cases, as higher indexes mean better performance (MB/s) the higher the result the better the performance.

<<-----Цитата----<<

> как это перевести в гигафлопсы

Я уверен, что способ есть, вот только зачем?

*** ()
[#] Ответ на: комментарий от kranky 13.08.2010 22:06:37  
Reset

Затем, что работу числодробильни принято оценивать в гигафлопсах, так как это число легко переводится потом в секунды для заданного проца. А мегапиксели это непонятные попугаи, которые вообще ни о чем не говорят.

***** ()
[#] Ответ на: комментарий от Reset 13.08.2010 22:19:20  
kranky

>А мегапиксели это непонятные попугаи, которые вообще ни о чем не говорят.

Ну вообще там же сравнительный тест, и без разницы в каких попугаях будут результаты... Но раз очень хочется, то перевести можно так: (количество_флопсов_для_рассчёта_одного_пикселя * количество_мегапикселей / 1000) и ты получишь количество твоих любимых гигафлопсов. Количество флопов на один пиксель узнавай у разработчиков SiSoft Sandra.

*** ()
[#]  

Сравнивая закрытую технологию, лоченую на одного вендора и открытую, поддерживаемую, монстрами современной ИТ индустрии(Интел, амд, эпл, да и таже нвидия) очень глупо выбирать куду, даже если она имеет небольшие плюсы. Куда тож не сразу строилась и первые релизы были оч далеки от того, что есть сейчас. Выбор очевидет. С опенцл будет рост, будет поддержка разного железа и ос.

anonymous ()
[#] Ответ на: комментарий от kranky 13.08.2010 21:00:41  

Это сравнение теплого с мягким, в этом тесте сравнивают разную программную архитектуру на разной хардварной. ОпенЦЛ такой же как и куда, ну максимум там будет отстование 3-5% потому что будет трансляция в куду, как и в стремСДК

()
[#]  

на 3хх0 хрен они положили?

пора апгрейдиться однако

** ()
[#] Ответ на: комментарий от unfo 13.08.2010 21:20:36  

>К сожалению, не для всех задач есть готовые либы. А в фортране точность более, чем приличная.

А в большинстве GPU от NVIDIA - менее, чем приличная

***## ()
[#]  
SimonPhoenix

>Работал и с кудой, и с opencl. Разница в производительности в пределах погрешности, по крайней мере на видюхах нвидии. Апи практически одинаковые, практически вся разница в названиях. И да, куча троллей в топике детектед. Особенно орущие про непонятный апи и тормознутость по сравнению с кудой. Они (эти тролли) не нужны.

анонимус пости еще, кроме тебя в данном трэде(да и на лоре тож) одни дуболомы тусуются... я хуе, куда лор катится...

()
[#] Ответ на: комментарий от kranky 13.08.2010 22:30:23  
Reset

Кстати тут еще и непонятно что они считают. Идеальным тестом был бы замер производительности blas 1,2,3 в гигафлопсах. В общем, у меня доверия к этим тестам нет.

***** ()
[#] Ответ на: комментарий от Reset 14.08.2010 13:32:53  
kranky

Ну а тесты, подтверждающие, что оно сильно хуже Куды будут или ты просто лужы погазифицировать зашёл?

*** ()
[#] Ответ на: комментарий от kranky 14.08.2010 13:38:57  
Reset

Берем последний nvidia gpucomputing sdk, берем оттуда matrixMul и oclMatrixMul, выставляем blocksize=32, n=4096. Получаем на gtx460 500gflops на cuda и 120gflops на opencl. На opencl еще и blocksize не увеличивается. Если 64 выставить, то cuda еще быстрее будет работать.

В итоге на opencl кода в разы больше, а работает в 4 раза медленее.

***** ()
[#]  
NIR

Я удивляюсь. Тут выпустили такую хорошую штуку, но зажравшиеся линупсоиды снова недовольны и требуют больше. Сделали скринкаст? Говно! Открыли сорцы движка игры? Говно! Выпустили SDK? Говно! Аналитики совсем офигели.

()
[#]  
stalkerg

Чё сприть то если Cuda тока на nvidia работает?

**** ()
[#]  

Хмм...

Table A.1    Functions Supported by cl_amd_fp64
 X = Supported * = Beta                     Evergreen(*1 RV770(*2 x86 CPU
               Query clGetDeviceInfo() with
                                                X        *       X
               CL_DEVICE_DOUBLE_FP_CONFIG
               double conversions               X        *       X
               type: double                     X        *       X
               type: double2                    X        *       X
               type: double3                    X        *       X
  Types
               type: double4                    X        *       X
               type: double8                    X        *       X
               type: double16                   X        *       X

1. ATI Radeon™ HD 5900 series GPUs, ATI Radeon™ HD 5800 series GPUs, ATI
   FirePro™ V8800 series GPUs, ATI FirePro™ V7800 series GPUs and AMD
   FireStream™ 9300 series GPU Compute Accelerators.
2. ATI Radeon™ HD 4800 series GPUs, ATI Mobility Radeon™ HD 4800 series GPUs,
   ATI FirePro™ V8700 series GPUs and AMD FireStream™ 9200 series GPUs.

Я так понял под циферкой 2 никуда не годное Г ... надо запомнить

***** ()
[#] Ответ на: комментарий от sS 15.08.2010 11:52:06  

Или просто не тестировали как следует ?

***** ()