ATI Stream Software Development Kit (SDK) v2.2

amd, ati stream, opencl

0

0

Спустя 2 месяца после того, как Khronos Group выпустила спецификацию для OpenCL версии 1.1, поддержка данного стандарта появилась и в кроссплатформенной среде разработки от AMD - Stream SDK 2.2.

Кроме этого в новую версию добавлены:

Поддержка Ubuntu 10.04 и Red Hat Enterprise Linux 5.5
Поддержка процессоров с SSE2 и старше
Поддержка GCC 4.1 и старше
Создание и загрузка бинарных OpenCL-ядер

И многое другое.

ATI Stream SDK 2.2 доступен для скачивания с сайта developer.amd.com. Там же можно посмотреть документацию.

>>> Подробности

Ссылка

← Oracle подал в суд на Google за использование Java на Android

Oracle закрывает проект OpenSolaris →

а я-то думал что смысл OpenCL в отсутствие вендор-ангажированных средств разработки(

annulen ★★★★★
(13.08.10 20:01:14 MSK)

Оно сильно хуже в плане возможностей/производительности по сравнению с кудой?

unfo ★★★★★
(13.08.10 20:04:05 MSK)

Ответ на: комментарий от unfo 13.08.10 20:04:05 MSK

Оно сильно хуже в плане возможностей/производительности по сравнению с кудой?

Есть субъективное ощущение, что оно сильно неудобнее. В куде обещали едва ли не поддержку Питона. И всяко кроме гольного C/C++ там есть Фортран, что для математических рассчётов очень важно.

Vudod ★★★★★
(13.08.10 20:16:01 MSK)

Ответ на: комментарий от annulen 13.08.10 20:01:14 MSK

смысл OpenCL такой же, как у OpenGL

note173 ★★★★★
(13.08.10 20:19:36 MSK)

Ссылка

Ответ на: комментарий от Vudod 13.08.10 20:16:01 MSK

Про фортран не знал, спасибо. В сильных числодробилках вполне может пригодиться.

unfo ★★★★★
(13.08.10 20:20:51 MSK)

Почему стрёмное то?

anonymous
(13.08.10 20:26:24 MSK)

Ссылка

Ответ на: комментарий от unfo 13.08.10 20:04:05 MSK

> Оно сильно хуже в плане производительности по сравнению с кудой?

Сильно.

axel92
(13.08.10 20:31:03 MSK)

Ссылка

Ответ на: комментарий от unfo 13.08.10 20:04:05 MSK

Сильно. Если нужна кроссплатформенность, то на куде надо писать и отлаживать, а потом портировать на OpenCL, да и то геморройно будет ибо в OpenCL нет многих вещей.

Reset ★★★★★
(13.08.10 20:37:00 MSK)

Ссылка

Ответ на: комментарий от unfo 13.08.10 20:04:05 MSK

>Оно сильно хуже в плане возможностей/производительности по сравнению с кудой?

Ничуть не хуже.

anonymous
(13.08.10 20:37:40 MSK)

Все стандарты Хроноса просты и понятны для граждан созвездия Псов )0@0(

anonymous
(13.08.10 20:41:17 MSK)

Ссылка

Ответ на: комментарий от anonymous 13.08.10 20:37:40 MSK

и кому верить? Пруфы в студию.

nevar ★★
(13.08.10 20:41:32 MSK)

Ссылка

Ответ на: комментарий от anonymous 13.08.10 20:37:40 MSK

Пруф? А то у меня другие данные.

axel92
(13.08.10 20:42:06 MSK)

Ответ на: комментарий от anonymous 13.08.10 20:37:40 MSK

ололо, толстенький. ты сам-то пробовал их юзать или только по рекламным статейкам судишь ?

anonymous
(13.08.10 20:43:48 MSK)

Ссылка

Ответ на: комментарий от Vudod 13.08.10 20:16:01 MSK

>И всяко кроме гольного C/C++ там есть Фортран, что для математических рассчётов очень важно.

слинковать фортранный код с С/С++ довольно просто

annulen ★★★★★
(13.08.10 20:49:52 MSK)

Ссылка

Ответ на: комментарий от axel92 13.08.10 20:42:06 MSK

>Пруф? А то у меня другие данные.

Вот например. http://www.sisoftware.net/?d=qa&f=gpu_opencl&l=ru&a=
Плюс тесты не самые новые (на forceware 190.*), с тех пор пофиксили много проблем с производительностью. Кроме того, сдаётся мне, нвидиевский компилятор препроцессингом превращает опенцл-ядро в куда-ядро и потом компилирует, и разницы в скорости практически не будет.

А теперь давай пруфы твоих «других данных».

kranky ★★★★★
(13.08.10 20:50:21 MSK) автор топика

Ответ на: комментарий от kranky 13.08.10 20:50:21 MSK

Товарищь Reset любезно поделился в соседней ветке

http://www.geeks3d.com/20100119/test-gpu-computing-geforce-and-radeon-opencl-...

axel92
(13.08.10 20:58:16 MSK)

Ответ на: комментарий от axel92 13.08.10 20:58:16 MSK

>http://www.geeks3d.com/20100119/test-gpu-computing-geforce-and-radeon-opencl-...

лолчто? по ссылке нет ни слова про Куду.

kranky ★★★★★
(13.08.10 21:00:41 MSK) автор топика

Ответ на: комментарий от unfo 13.08.10 20:20:51 MSK

> В сильных числодробилках вполне может пригодиться.

Для числодробилки вполне подойдет готовая GPU-ускоренная либа

annulen ★★★★★
(13.08.10 21:01:41 MSK)

MinGW тоже добавили, и Виндовый компилятор 2010 тоже.

anonymous
(13.08.10 21:02:56 MSK)

Ссылка

Ответ на: комментарий от kranky 13.08.10 21:00:41 MSK

а черт перепутал, я про stream и openCL думал, что за день сегодня такой...

axel92
(13.08.10 21:03:44 MSK)

Ссылка

Ответ на: комментарий от annulen 13.08.10 21:01:41 MSK

К сожалению, не для всех задач есть готовые либы. А в фортране точность более, чем приличная.

unfo ★★★★★
(13.08.10 21:20:36 MSK)

Ответ на: комментарий от unfo 13.08.10 21:20:36 MSK

>более чем

fixed

unfo ★★★★★
(13.08.10 21:22:36 MSK)

Ссылка

Ответ на: комментарий от kranky 13.08.10 20:50:21 MSK

Чего такое MPixel/s и как это перевести в гигафлопсы?

Reset ★★★★★
(13.08.10 21:29:59 MSK)

Работал и с кудой, и с opencl. Разница в производительности в пределах погрешности, по крайней мере на видюхах нвидии. Апи практически одинаковые, практически вся разница в названиях. И да, куча троллей в топике детектед. Особенно орущие про непонятный апи и тормознутость по сравнению с кудой. Они (эти тролли) не нужны.

anonymous
(13.08.10 21:38:49 MSK)

Ответ на: комментарий от anonymous 13.08.10 21:38:49 MSK

в тоже время, нельзя сказать, что апи такой уж понятный и очевидный
кому надо - разберутся без проблем, но порог вхождения таки есть

note173 ★★★★★
(13.08.10 21:42:42 MSK)

Ответ на: комментарий от note173 13.08.10 21:42:42 MSK

Порог вхождения есть, хотя бы потому, но он не больше, чем порог вхождения в ту же CUDA, и намного меньше, чем в DirectCompute.

anonymous
(13.08.10 21:44:37 MSK)

Ответ на: комментарий от anonymous 13.08.10 21:44:37 MSK

s/ хотя бы потому,//

селффикс

anonymous
(13.08.10 21:45:25 MSK)

Ссылка

Ответ на: комментарий от anonymous 13.08.10 21:38:49 MSK

>Работал и с кудой, и с opencl. Разница в производительности в пределах погрешности, по крайней мере на видюхах нвидии. Апи практически одинаковые, практически вся разница в названиях. И да, куча троллей в топике детектед. Особенно орущие про непонятный апи и тормознутость по сравнению с кудой. Они (эти тролли) не нужны.

Спасибо, добрый человек, за информацию.

unfo ★★★★★
(13.08.10 21:58:45 MSK)

Ссылка

Ответ на: комментарий от Reset 13.08.10 21:29:59 MSK

Чего такое MPixel/s

Чукча не читатель?

The arithmetic results are in pixels/s, i.e. how many pixels can be computed in 1 second. In all cases, as higher indexes mean better performance (pixels/s) the higher the result the better the performance. The memory results are in MB/s, i.e. how many MB can be transferred in 1 second. In all cases, as higher indexes mean better performance (MB/s) the higher the result the better the performance.

как это перевести в гигафлопсы

Я уверен, что способ есть, вот только зачем?

kranky ★★★★★
(13.08.10 22:06:37 MSK) автор топика

Ответ на: комментарий от kranky 13.08.10 22:06:37 MSK

Затем, что работу числодробильни принято оценивать в гигафлопсах, так как это число легко переводится потом в секунды для заданного проца. А мегапиксели это непонятные попугаи, которые вообще ни о чем не говорят.

Reset ★★★★★
(13.08.10 22:19:20 MSK)

Ответ на: комментарий от Reset 13.08.10 22:19:20 MSK

А мегапиксели это непонятные попугаи, которые вообще ни о чем не говорят.

Ну вообще там же сравнительный тест, и без разницы в каких попугаях будут результаты... Но раз очень хочется, то перевести можно так: (количество_флопсов_для_рассчёта_одного_пикселя * количество_мегапикселей / 1000) и ты получишь количество твоих любимых гигафлопсов. Количество флопов на один пиксель узнавай у разработчиков SiSoft Sandra.

kranky ★★★★★
(13.08.10 22:30:23 MSK) автор топика

Сравнивая закрытую технологию, лоченую на одного вендора и открытую, поддерживаемую, монстрами современной ИТ индустрии(Интел, амд, эпл, да и таже нвидия) очень глупо выбирать куду, даже если она имеет небольшие плюсы. Куда тож не сразу строилась и первые релизы были оч далеки от того, что есть сейчас. Выбор очевидет. С опенцл будет рост, будет поддержка разного железа и ос.

anonymous
(13.08.10 22:36:10 MSK)

Ссылка

Ответ на: комментарий от kranky 13.08.10 21:00:41 MSK

Это сравнение теплого с мягким, в этом тесте сравнивают разную программную архитектуру на разной хардварной. ОпенЦЛ такой же как и куда, ну максимум там будет отстование 3-5% потому что будет трансляция в куду, как и в стремСДК

strelok
(13.08.10 23:41:43 MSK)

Ссылка

на 3хх0 хрен они положили?

пора апгрейдиться однако

~~One~~ ★★★★★
(14.08.10 00:32:09 MSK)

Ссылка

Ответ на: комментарий от unfo 13.08.10 21:20:36 MSK

>К сожалению, не для всех задач есть готовые либы. А в фортране точность более, чем приличная.

А в большинстве GPU от NVIDIA - менее, чем приличная

Led ★★★☆☆
(14.08.10 01:54:43 MSK)

Ссылка

Работал и с кудой, и с opencl. Разница в производительности в пределах погрешности, по крайней мере на видюхах нвидии. Апи практически одинаковые, практически вся разница в названиях. И да, куча троллей в топике детектед. Особенно орущие про непонятный апи и тормознутость по сравнению с кудой. Они (эти тролли) не нужны.

анонимус пости еще, кроме тебя в данном трэде(да и на лоре тож) одни дуболомы тусуются... я хуе, куда лор катится...

~~SimonPhoenix~~
(14.08.10 02:32:35 MSK)

Ссылка

Ответ на: комментарий от kranky 13.08.10 22:30:23 MSK

Кстати тут еще и непонятно что они считают. Идеальным тестом был бы замер производительности blas 1,2,3 в гигафлопсах. В общем, у меня доверия к этим тестам нет.

Reset ★★★★★
(14.08.10 13:32:53 MSK)

Ответ на: комментарий от Reset 14.08.10 13:32:53 MSK

Ну а тесты, подтверждающие, что оно сильно хуже Куды будут или ты просто лужы погазифицировать зашёл?

kranky ★★★★★
(14.08.10 13:38:57 MSK) автор топика

Ответ на: комментарий от kranky 14.08.10 13:38:57 MSK

Берем последний nvidia gpucomputing sdk, берем оттуда matrixMul и oclMatrixMul, выставляем blocksize=32, n=4096. Получаем на gtx460 500gflops на cuda и 120gflops на opencl. На opencl еще и blocksize не увеличивается. Если 64 выставить, то cuda еще быстрее будет работать.

В итоге на opencl кода в разы больше, а работает в 4 раза медленее.

Reset ★★★★★
(14.08.10 14:11:52 MSK)

Ссылка

Я удивляюсь. Тут выпустили такую хорошую штуку, но зажравшиеся линупсоиды снова недовольны и требуют больше. Сделали скринкаст? Говно! Открыли сорцы движка игры? Говно! Выпустили SDK? Говно! Аналитики совсем офигели.

NIR ★
(14.08.10 16:08:59 MSK)

Ссылка

Чё сприть то если Cuda тока на nvidia работает?

stalkerg ★★★★★
(14.08.10 17:32:31 MSK)

Ссылка

Хмм...

Table A.1    Functions Supported by cl_amd_fp64
 X = Supported * = Beta                     Evergreen(*1 RV770(*2 x86 CPU
               Query clGetDeviceInfo() with
                                                X        *       X
               CL_DEVICE_DOUBLE_FP_CONFIG
               double conversions               X        *       X
               type: double                     X        *       X
               type: double2                    X        *       X
               type: double3                    X        *       X
  Types
               type: double4                    X        *       X
               type: double8                    X        *       X
               type: double16                   X        *       X

1. ATI Radeon™ HD 5900 series GPUs, ATI Radeon™ HD 5800 series GPUs, ATI
   FirePro™ V8800 series GPUs, ATI FirePro™ V7800 series GPUs and AMD
   FireStream™ 9300 series GPU Compute Accelerators.
2. ATI Radeon™ HD 4800 series GPUs, ATI Mobility Radeon™ HD 4800 series GPUs,
   ATI FirePro™ V8700 series GPUs and AMD FireStream™ 9200 series GPUs.

Я так понял под циферкой 2 никуда не годное Г ... надо запомнить

sS ★★★★★
(15.08.10 11:52:06 MSK)