LINUX.ORG.RU

ATI Stream Software Development Kit (SDK) v2.2

 , ,


0

0

Спустя 2 месяца после того, как Khronos Group выпустила спецификацию для OpenCL версии 1.1, поддержка данного стандарта появилась и в кроссплатформенной среде разработки от AMD - Stream SDK 2.2.

Кроме этого в новую версию добавлены:

  • Поддержка Ubuntu 10.04 и Red Hat Enterprise Linux 5.5
  • Поддержка процессоров с SSE2 и старше
  • Поддержка GCC 4.1 и старше
  • Создание и загрузка бинарных OpenCL-ядер

И многое другое.

ATI Stream SDK 2.2 доступен для скачивания с сайта developer.amd.com. Там же можно посмотреть документацию.

>>> Подробности

★★★★★

Проверено: svu ()

а я-то думал что смысл OpenCL в отсутствие вендор-ангажированных средств разработки(

annulen ★★★★★ ()

Оно сильно хуже в плане возможностей/производительности по сравнению с кудой?

unfo ★★★★★ ()
Ответ на: комментарий от unfo

Оно сильно хуже в плане возможностей/производительности по сравнению с кудой?

Есть субъективное ощущение, что оно сильно неудобнее. В куде обещали едва ли не поддержку Питона. И всяко кроме гольного C/C++ там есть Фортран, что для математических рассчётов очень важно.

Vudod ★★★★★ ()
Ответ на: комментарий от Vudod

Про фортран не знал, спасибо. В сильных числодробилках вполне может пригодиться.

unfo ★★★★★ ()

Почему стрёмное то?

anonymous ()
Ответ на: комментарий от unfo

> Оно сильно хуже в плане производительности по сравнению с кудой?

Сильно.

axel92 ()
Ответ на: комментарий от unfo

Сильно. Если нужна кроссплатформенность, то на куде надо писать и отлаживать, а потом портировать на OpenCL, да и то геморройно будет ибо в OpenCL нет многих вещей.

Reset ★★★★★ ()
Ответ на: комментарий от unfo

>Оно сильно хуже в плане возможностей/производительности по сравнению с кудой?

Ничуть не хуже.

anonymous ()

Все стандарты Хроноса просты и понятны для граждан созвездия Псов )0@0(

anonymous ()
Ответ на: комментарий от anonymous

ололо, толстенький. ты сам-то пробовал их юзать или только по рекламным статейкам судишь ?

anonymous ()
Ответ на: комментарий от Vudod

>И всяко кроме гольного C/C++ там есть Фортран, что для математических рассчётов очень важно.

слинковать фортранный код с С/С++ довольно просто

annulen ★★★★★ ()
Ответ на: комментарий от axel92

>Пруф? А то у меня другие данные.

Вот например. http://www.sisoftware.net/?d=qa&f=gpu_opencl&l=ru&a=
Плюс тесты не самые новые (на forceware 190.*), с тех пор пофиксили много проблем с производительностью. Кроме того, сдаётся мне, нвидиевский компилятор препроцессингом превращает опенцл-ядро в куда-ядро и потом компилирует, и разницы в скорости практически не будет.

А теперь давай пруфы твоих «других данных».

kranky ★★★★★ ()
Ответ на: комментарий от unfo

> В сильных числодробилках вполне может пригодиться.

Для числодробилки вполне подойдет готовая GPU-ускоренная либа

annulen ★★★★★ ()

MinGW тоже добавили, и Виндовый компилятор 2010 тоже.

anonymous ()
Ответ на: комментарий от kranky

а черт перепутал, я про stream и openCL думал, что за день сегодня такой...

axel92 ()
Ответ на: комментарий от annulen

К сожалению, не для всех задач есть готовые либы. А в фортране точность более, чем приличная.

unfo ★★★★★ ()
Ответ на: комментарий от kranky

Чего такое MPixel/s и как это перевести в гигафлопсы?

Reset ★★★★★ ()

Работал и с кудой, и с opencl. Разница в производительности в пределах погрешности, по крайней мере на видюхах нвидии. Апи практически одинаковые, практически вся разница в названиях. И да, куча троллей в топике детектед. Особенно орущие про непонятный апи и тормознутость по сравнению с кудой. Они (эти тролли) не нужны.

anonymous ()
Ответ на: комментарий от anonymous

в тоже время, нельзя сказать, что апи такой уж понятный и очевидный
кому надо - разберутся без проблем, но порог вхождения таки есть

note173 ★★★★★ ()
Ответ на: комментарий от note173

Порог вхождения есть, хотя бы потому, но он не больше, чем порог вхождения в ту же CUDA, и намного меньше, чем в DirectCompute.

anonymous ()
Ответ на: комментарий от anonymous

>Работал и с кудой, и с opencl. Разница в производительности в пределах погрешности, по крайней мере на видюхах нвидии. Апи практически одинаковые, практически вся разница в названиях. И да, куча троллей в топике детектед. Особенно орущие про непонятный апи и тормознутость по сравнению с кудой. Они (эти тролли) не нужны.

Спасибо, добрый человек, за информацию.

unfo ★★★★★ ()
Ответ на: комментарий от Reset

Чего такое MPixel/s

Чукча не читатель?

The arithmetic results are in pixels/s, i.e. how many pixels can be computed in 1 second. In all cases, as higher indexes mean better performance (pixels/s) the higher the result the better the performance. The memory results are in MB/s, i.e. how many MB can be transferred in 1 second. In all cases, as higher indexes mean better performance (MB/s) the higher the result the better the performance.

как это перевести в гигафлопсы

Я уверен, что способ есть, вот только зачем?

kranky ★★★★★ ()
Ответ на: комментарий от kranky

Затем, что работу числодробильни принято оценивать в гигафлопсах, так как это число легко переводится потом в секунды для заданного проца. А мегапиксели это непонятные попугаи, которые вообще ни о чем не говорят.

Reset ★★★★★ ()
Ответ на: комментарий от Reset

А мегапиксели это непонятные попугаи, которые вообще ни о чем не говорят.

Ну вообще там же сравнительный тест, и без разницы в каких попугаях будут результаты... Но раз очень хочется, то перевести можно так: (количество_флопсов_для_рассчёта_одного_пикселя * количество_мегапикселей / 1000) и ты получишь количество твоих любимых гигафлопсов. Количество флопов на один пиксель узнавай у разработчиков SiSoft Sandra.

kranky ★★★★★ ()

Сравнивая закрытую технологию, лоченую на одного вендора и открытую, поддерживаемую, монстрами современной ИТ индустрии(Интел, амд, эпл, да и таже нвидия) очень глупо выбирать куду, даже если она имеет небольшие плюсы. Куда тож не сразу строилась и первые релизы были оч далеки от того, что есть сейчас. Выбор очевидет. С опенцл будет рост, будет поддержка разного железа и ос.

anonymous ()
Ответ на: комментарий от kranky

Это сравнение теплого с мягким, в этом тесте сравнивают разную программную архитектуру на разной хардварной. ОпенЦЛ такой же как и куда, ну максимум там будет отстование 3-5% потому что будет трансляция в куду, как и в стремСДК

strelok ()

на 3хх0 хрен они положили?

пора апгрейдиться однако

One ★★★ ()
Ответ на: комментарий от unfo

>К сожалению, не для всех задач есть готовые либы. А в фортране точность более, чем приличная.

А в большинстве GPU от NVIDIA - менее, чем приличная

Led ★★★☆☆ ()

Работал и с кудой, и с opencl. Разница в производительности в пределах погрешности, по крайней мере на видюхах нвидии. Апи практически одинаковые, практически вся разница в названиях. И да, куча троллей в топике детектед. Особенно орущие про непонятный апи и тормознутость по сравнению с кудой. Они (эти тролли) не нужны.

анонимус пости еще, кроме тебя в данном трэде(да и на лоре тож) одни дуболомы тусуются... я хуе, куда лор катится...

SimonPhoenix ()
Ответ на: комментарий от kranky

Кстати тут еще и непонятно что они считают. Идеальным тестом был бы замер производительности blas 1,2,3 в гигафлопсах. В общем, у меня доверия к этим тестам нет.

Reset ★★★★★ ()
Ответ на: комментарий от Reset

Ну а тесты, подтверждающие, что оно сильно хуже Куды будут или ты просто лужы погазифицировать зашёл?

kranky ★★★★★ ()
Ответ на: комментарий от kranky

Берем последний nvidia gpucomputing sdk, берем оттуда matrixMul и oclMatrixMul, выставляем blocksize=32, n=4096. Получаем на gtx460 500gflops на cuda и 120gflops на opencl. На opencl еще и blocksize не увеличивается. Если 64 выставить, то cuda еще быстрее будет работать.

В итоге на opencl кода в разы больше, а работает в 4 раза медленее.

Reset ★★★★★ ()

Я удивляюсь. Тут выпустили такую хорошую штуку, но зажравшиеся линупсоиды снова недовольны и требуют больше. Сделали скринкаст? Говно! Открыли сорцы движка игры? Говно! Выпустили SDK? Говно! Аналитики совсем офигели.

NIR ()

Чё сприть то если Cuda тока на nvidia работает?

stalkerg ★★★★★ ()

Хмм...

Table A.1    Functions Supported by cl_amd_fp64
 X = Supported * = Beta                     Evergreen(*1 RV770(*2 x86 CPU
               Query clGetDeviceInfo() with
                                                X        *       X
               CL_DEVICE_DOUBLE_FP_CONFIG
               double conversions               X        *       X
               type: double                     X        *       X
               type: double2                    X        *       X
               type: double3                    X        *       X
  Types
               type: double4                    X        *       X
               type: double8                    X        *       X
               type: double16                   X        *       X

1. ATI Radeon™ HD 5900 series GPUs, ATI Radeon™ HD 5800 series GPUs, ATI
   FirePro™ V8800 series GPUs, ATI FirePro™ V7800 series GPUs and AMD
   FireStream™ 9300 series GPU Compute Accelerators.
2. ATI Radeon™ HD 4800 series GPUs, ATI Mobility Radeon™ HD 4800 series GPUs,
   ATI FirePro™ V8700 series GPUs and AMD FireStream™ 9200 series GPUs.

Я так понял под циферкой 2 никуда не годное Г ... надо запомнить

sS ★★★★★ ()
Ответ на: комментарий от sS

Или просто не тестировали как следует ?

sS ★★★★★ ()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.