Компания AMD открыла код ROCm — собственной реализации OpenCL — Hardware and Drivers

Ответ на: комментарий от shielcody 14.05.17 13:01:42 MSK

Оно в 1000раз медленнее реалтайма. Как будет в районе порядка - приходи.
Реалтайма даже в районе 5порядков нет.

Откуда эти данные? Вот код - https://github.com/google/FluidNet, можешь сам все проверить и сравнить.

Каких данных - чего сгенерено? Я бы сказал что там у тебя неограниченно.

Ты что-ли вообще не понимаешь как работают нейросети? Для их тренировки нужны большие объемы данных и это обычно проблема. Но в области графики таких данных можно сгенерировать практически бесконечное количество.

Вот еще один пример в графике - сеть тренируют увеличивать картинки. https://github.com/Tetrachrome/subpixel

Про ГО вообще смешно читать что ты написал. 10 строк кода, лол. Если так все просто, то чего-же никто так и не написал программу (без нейросетей) которая побеждает лучших из людей?

EvgenijM86 ★
(14.05.17 14:58:33 MSK)

Ссылка

Ответ на: комментарий от awoland 14.05.17 14:55:02 MSK

В рамках проекта «Фазово-функциональная нейронная сеть» (Phase-Functioned Neural Network) учёные разработали самообучающуюся систему, которая позволяет моделировать движения виртуального персонажа в реальном времени.

Вы всё врете! Это жидовский заговор! На самом деле ничего не работает!

EvgenijM86 ★
(14.05.17 15:18:46 MSK)

Ссылка

Область применения этого чуда?

anonymoos ★★★★★
(14.05.17 15:32:29 MSK)

Блджад, столько тупняка в одном треде давно не видывал.

anonymous
(14.05.17 15:49:16 MSK)

Ссылка

Ответ на: комментарий от dn2010 14.05.17 13:29:29 MSK

Уже ж сделали супербота на нейросетках почти для всех популярных некогда игрушек. Теперь ждём такого же от производителей

Это другое, супербот эмулировал игрока, узнавал об игровой ситуации по картинке на экране и управлял как бы нажимая на кнопки. Внутриигровому ИИ это не надо.

khrundel ★★★★
(14.05.17 17:21:58 MSK)

Ответ на: комментарий от khrundel 14.05.17 17:21:58 MSK

Внутриигровому AI не надо распознавать картинку, принимать в текущей игровой ситуации правильное (или человеческое) решение ему всё равно надо, если он не скучный заскриптованный монстр, которых ты косишь тысячами.

dn2010 ★★★★★
(14.05.17 17:36:54 MSK)

Ответ на: комментарий от Sunderland93 13.05.17 20:11:31 MSK

Хитрые трюки для ускорения обучения сетей, да.

Solace ★★
(14.05.17 18:16:24 MSK)

Ссылка

Ответ на: комментарий от Sunderland93 13.05.17 20:11:31 MSK

Библиотека быстрых примитивов для операций, используемых внутри нейросеток, работающая как промежуточный уровень между CUDA и фреймворками самих нейросеток.

dn2010 ★★★★★
(14.05.17 18:23:27 MSK)

Ссылка

На этом амд даже гном лагает, так что да, лучший опенсорсный драйвер пока что у интела.

Deliverance ★★
(14.05.17 23:04:50 MSK)

Ответ на: комментарий от dn2010 14.05.17 17:36:54 MSK

Вот только «человечность» решения определяется не тем, скрипт это или нейросеть, а как раз теми проблемами, с которыми внутриигровой ИИ не сталкивается. Человек по-разному обнаруживает объекты в зависимости от их контрастности к фону, пестрости объекта и фона, их статичности или движения. Человек ограничен в способности следить за слишком большим числом объектов, в памяти, в скорости реакции, скорости принятия решений и в темпе выдачи управляющих команд. Человек утомляем и подвержен эмоциям. Нейросети не обладают этими свойствами. Чтоб нейросеть вела себя так, всё это нужно прописать вне её, моделировать зрение, центр внимания, усталость. Соответственно вся «человечность» окажется скриптами и формулами.

khrundel ★★★★
(14.05.17 23:12:43 MSK)

Ответ на: комментарий от khrundel 14.05.17 23:12:43 MSK

Человечность нейросети можно вполне задавать теми примерами, на которых она учится, обучить её играть в танки исключительно на игроках с винрейтом сильно меньше половины, и она тоже будет изображать из себя оленеводческий совхоз имени Сергея Буркатовского, рашить по центру или работать героическим подкустовым выползнем не сильно хуже среднестатистического школьника-танкиста.

dn2010 ★★★★★
(14.05.17 23:23:01 MSK)

Ссылка

Ответ на: комментарий от Deliverance 14.05.17 23:04:50 MSK

Во первых это не графический драйвер, во вторых у Intelа не в git-снапшотах последний стабильный драйвер нерабочий вообще, если не откатывать 2D ускорение на legacy техники вручную, а в git он только изредка фризится при выходе, например, из 3D скринсейвера.

dn2010 ★★★★★
(14.05.17 23:26:06 MSK)

Ответ на: комментарий от dn2010 14.05.17 13:19:38 MSK

Реализации OpenCL работают, твоя проблема - что нет чего-то конкретного, написанного на OpenCL. Ну не повезло. Есть готовые опенсорсные библиотеки для BLAS и FFT, хэши для майнинга. Чего-то, написанного под куду, нет на OpenCL - всё можно дописать и расширить список поддерживаемого железа.

в molecular modelling есть рабочее на cuda и есть тестовое на opencl, которое кроме как на nvidia нигде не заводится из-за различий в реализации

А есть ссылка на реализацию? Там может быть как два пальца просто поправить - на C никогда не было проблемой писать нестандартный код который работает мимо спецификаций на одной реализации.

tim239 ★★
(15.05.17 01:03:53 MSK)

Ответ на: комментарий от shielcody 14.05.17 10:54:53 MSK

Да это очередной обчитавшийся всяких желтушных гиктаймсов и теперь фрилансящий кодогенерирующей нейросетью из умного марксианского поселения куда он долетел на ракете Маска.

anonymous
(15.05.17 03:41:46 MSK)

Ссылка

Ответ на: комментарий от tim239 15.05.17 01:03:53 MSK

Написать всё можно, только зелёные написали всё нужное уже несколько лет назад, а с opencl оно те же несколько лет пребывает в состоянии «почти всё работает, кроме вашего»

Вот, например, библиотека для расчётов: https://simtk.org/projects/openmm

dn2010 ★★★★★
(15.05.17 06:16:42 MSK)

Ссылка

Ответ на: комментарий от dn2010 13.05.17 10:01:25 MSK

OpenCL дофига кто поддерживает. Это промышленный стандарт. Мало кто умеет сейчас CUDA-only.

~~Quasar~~ ★★★★★
(15.05.17 07:54:29 MSK)

Ответ на: комментарий от anonymous 13.05.17 13:42:34 MSK

Эта cuDNN - нафиг не нужное говнище. Лучше взять FPGA и на ней реализовать ускорение интересующего алгоритма в этой области. Будет быстрее и меньше энергии жрать. А ещё гибкость реализации алгоритмов куда выше.

~~Quasar~~ ★★★★★
(15.05.17 07:56:18 MSK)

Ответ на: комментарий от anonymous 13.05.17 15:48:19 MSK

Невидия... Это та самая контора, которая до сих пор не может осилить профилировщик графического стека? Та самая контора, которая до сих пор OpenGL 4 не поддерживает? Та самая контора, которая нормальные драйверы для линуксе уже дофига лет выпустить не может? Та самая контора, которая зажимает спецификации на свои чипы и прямым тестом о характеристиках чипа врёт в описании? Ну офигеть впереди.

~~Quasar~~ ★★★★★
(15.05.17 07:58:56 MSK)

Ссылка

Ответ на: комментарий от Sunderland93 13.05.17 20:11:31 MSK

Это нейросети, на вход которых подаются данные и на выходе которых получают данные с требуемыми параметрами. А нейросеть сама их перебирает и конечный результат делает. Эдакий динамический, но в конечном виде специализированный алгоритм, грубо говоря.

~~Quasar~~ ★★★★★
(15.05.17 08:01:33 MSK)

Ссылка

Ответ на: комментарий от Quasar 15.05.17 07:56:18 MSK

Ага, только на cuDNN ездят машинки, сегментируются рентгеновские снимки и раковые биопсии и вообще овердофига применений в промышленности, а FPGA-сеток как-то не очень видно, они все пока в академии, хотя пишут, что очень круто в перспективе, в отдалённом светлом будущем, дайте денег немного на развитие.

dn2010 ★★★★★
(15.05.17 08:03:12 MSK)

Ответ на: комментарий от EvgenijM86 14.05.17 05:34:26 MSK

В будущем в общем-то так и будет. Даже для игр уже разрабатывают методы прорисовки и симуляции физики использующие нейросети.

Вот только GPU сейчас жёстко сливает FPGA в этой задаче.

И топовые карточки (GV100) уже затачиваются именно под нейросети.

Они до сих пор сливают FPGA. Увеличение производительности в этой области раза эдак в 2-2.5 по сравнению с использованием CUDA - это пшик. В современных FPGA производительность гораздо выше. Так что использование видеокарты для нейросетей - это либо от нищенства либо от тупости.

~~Quasar~~ ★★★★★
(15.05.17 08:05:48 MSK)

Ответ на: комментарий от Quasar 15.05.17 07:54:29 MSK

OpenCL-only проги можно пересчитать по пальцам одной руки и они работают почти исключительно на костылях от nvidia. Почти все известные мне считающие на видюхах проги нормально работают с CUDA, иногда их получается завести в режиме ограниченной функциональности с использованием промышленного стандарта.

dn2010 ★★★★★
(15.05.17 08:07:07 MSK)

Ответ на: комментарий от Quasar 15.05.17 08:05:48 MSK

Покажи фоточку твоего считающего компа с FPGA?

dn2010 ★★★★★
(15.05.17 08:07:52 MSK)

Ответ на: комментарий от EvgenijM86 14.05.17 11:57:04 MSK

Это уже шарлатанство. Для моделирования физики другие подходы требуются, а не нейросеть, так как тут надо не додумывать, а строго выполнять законы физики. А уж дорисовка... это уже виртуальная шизофрения. Единственно верное направление сейчас - это оптимизация железа под отрисовку и реализация ускорения нормальных алгоритмов в железе, таких как рейтрейсинг. Но невидия предпочла начать скупать и уничтожать конторы, которые рейтрейсинг в реальном времени разрабатывают, так как невидиевские карточки сосут в этой задаче, а у AMD решения даже в текущем виде производительнее выходят. Да и по мнению Хуанга нафига технологии развивать, когда можно одну и ту же видяху продавать дофига лет, уток подразгоняя?

~~Quasar~~ ★★★★★
(15.05.17 08:10:28 MSK)

Ответ на: комментарий от shielcody 14.05.17 13:06:03 MSK

На самом деле VR уже вполне себе работает. Можно купить набор и играться сколько влезет. И там совсем не полторы демки, а целые полноценные игры.

~~Quasar~~ ★★★★★
(15.05.17 08:13:31 MSK)

Ссылка

Ответ на: комментарий от dn2010 14.05.17 13:19:38 MSK

В нейросетях CUDA используют от нищенства. В молекулярной динамике уже вовсю OpenCL используют. И то такое ускорения надо с осторожностью эксплуатировать. Не так давно уже хипстеры в лабораториях на CUDA обожглись тем, что после CUDA неправильные результаты выдавались, так как не было там поддержки стандарта с плавающей точкой. CPU в сложных вычислениях не заменить видеокартой, и FPGA в специализированных вычислениях тоже - факт.

~~Quasar~~ ★★★★★
(15.05.17 08:15:37 MSK)
Последнее исправление: Quasar 15.05.17 08:16:10 MSK (всего исправлений: 1)

Ответ на: комментарий от Quasar 15.05.17 08:15:37 MSK

Не так давно уже хипстеры в лабораториях на CUDA обожглись тем, что после CUDA неправильные результаты выдавались, так как не было там поддержки стандарта с плавающей точкой.

Что я только что увидел?

dn2010 ★★★★★
(15.05.17 08:18:34 MSK)

Ответ на: комментарий от dn2010 14.05.17 23:26:06 MSK

Во первых это не графический драйвер

А что тогда? У меня на всех ноутах с графикой амд такие проблемы.

Deliverance ★★
(15.05.17 08:20:04 MSK)

Ответ на: комментарий от anonymoos 14.05.17 15:32:29 MSK

Область применения - вычисления на GPU.

~~Quasar~~ ★★★★★
(15.05.17 08:20:10 MSK)

Ссылка

Ответ на: комментарий от dn2010 14.05.17 17:36:54 MSK

Вряд ли ресурсоёмкая нейросеть для такого монстра потребуется. Один фиг можно под обучение скрипты подготовить, которые будут вести статистику и определять тем самым тактику, если на то пошло.

~~Quasar~~ ★★★★★
(15.05.17 08:26:08 MSK)

Ответ на: комментарий от Deliverance 15.05.17 08:20:04 MSK

Тема про открытие блобика для вычислений на видюхах. Ну и опять же опенсорсный графический драйвер от AMD самый наверное беспроблемный, просто ставишь дистрибутив и всё работает, если дистрибутив старше или ровесник видеокарты, то подтягиваешь более свежий графический стек и всё работает ещё лучше. Блобики от nvidia, не поддерживающие последние дистрибутивные версии софта, или git dice от intel рядом не валяются.

dn2010 ★★★★★
(15.05.17 08:26:20 MSK)

Ссылка

Ответ на: комментарий от Quasar 15.05.17 08:26:08 MSK

Ну во первых нейросеть обученная может работать везде вплоть до мобильного телефона, во вторых их и придумали когда осознали, что мегабайты ifов все возможные случаи всё равно никогда не перебирают.

dn2010 ★★★★★
(15.05.17 08:28:05 MSK)

Ответ на: комментарий от dn2010 15.05.17 08:03:12 MSK

а FPGA-сеток как-то не очень видно, они все пока в академии

Есть такое. Но факт в том, что именно они будут рулить: https://www.nextplatform.com/2017/03/21/can-fpgas-beat-gpus-accelerating-next...

На GPU делать ставку не стоит.

~~Quasar~~ ★★★★★
(15.05.17 08:31:41 MSK)

Ответ на: комментарий от dn2010 15.05.17 08:07:07 MSK

OpenCL-only как таковое не имеет большого смысла. Есть смысл в факте поддержки OpenCL. Что там ещё пакет поддерживает - это уже другой вопрос. Ну а то, что много чего поддерживает CUDA, так это исторически сложилось, так как CUDA это первое широко распространённое API для GPGPU.

~~Quasar~~ ★★★★★
(15.05.17 08:33:14 MSK)

Ссылка

Ответ на: комментарий от dn2010 15.05.17 08:07:52 MSK

Такие не держу. Ссылку дал в комментарии выше.

~~Quasar~~ ★★★★★
(15.05.17 08:33:32 MSK)

Ссылка

Ответ на: комментарий от dn2010 15.05.17 08:18:34 MSK

Утверждение о том, что CUDA пытаются пихать даже туда, куда не следует.

~~Quasar~~ ★★★★★
(15.05.17 08:34:28 MSK)

Ссылка

Ответ на: комментарий от dn2010 15.05.17 08:28:05 MSK

В таком случае не нужно городить такие ускорители, так как достаточно поставить огромную машину со специальными процессорами, которые для нейросетей предназначены. Просто надо туда своевременно поставлять данные для обучения, а потом обученные нейросети раздавать. Всё.

~~Quasar~~ ★★★★★
(15.05.17 08:35:58 MSK)

Что это даст пока не понятно...

~~Latynyna~~
(15.05.17 09:05:58 MSK)

Ответ на: комментарий от Latynyna 15.05.17 09:05:58 MSK

Это даёт возможность не ставить блоб ради OpenCL на новых видеокартах. Сейчас в открытом драйвере есть практически всё - и OpenGL, и Vulkan, и теперь OpenCL прибавился. И производительность вполне на уровне.

~~Quasar~~ ★★★★★
(15.05.17 09:14:37 MSK)

Ссылка

Ответ на: комментарий от Quasar 15.05.17 08:31:41 MSK

Есть такое. Но факт в том, что именно они будут рулить: https://www.nextplatform.com/2017/03/21/can-fpgas-beat-gpus-accelerating-next...

На GPU делать ставку не стоит.

Когда будут рулить, тогда и придёшь, а сегодня рулят GPU. В любом гастрономе можно купить видеокарту за ~$1000 купить видеокарту и обучать нейросети. Где я могу купить аналогичную считалку на FPGA, и сколько это будет стоить?

И что значит «делать ставку», ёпт? Нейросети - это TensorFlow, Torch, Theano. Сейчас в них есть поддержка куды,лениво пилится поддержка OpenCL. Когда решения на FPGA станут эффективнее GPU - добавят поддержку FPGA.

anonymous
(15.05.17 09:48:46 MSK)

Ответ на: комментарий от Quasar 15.05.17 08:35:58 MSK

В таком случае не нужно городить такие ускорители, так как достаточно поставить огромную машину со специальными процессорами, которые для нейросетей предназначены. Просто надо туда своевременно поставлять данные для обучения, а потом обученные нейросети раздавать. Всё.

А мы против, что ли? Кинь ссылку, где купить твою специальную машину.

anonymous
(15.05.17 09:51:14 MSK)

Ссылка

Ответ на: комментарий от Quasar 15.05.17 08:31:41 MSK

Ключевое слово тут будут, доклад по ссылке делает инженегр из конторы, купившей альтеру и неосилившей сделать нормальную параллельную архитектуру для видеокарт.

dn2010 ★★★★★
(15.05.17 12:40:19 MSK)

Ссылка

Ответ на: комментарий от Quasar 15.05.17 08:35:58 MSK

Специальные процессоры, предназначенные для нейросетей, на данном этапе развития это CUDA-ядра от nvidia, и очень редко робкие ростки чего-то другого.

dn2010 ★★★★★
(15.05.17 12:41:57 MSK)

Ответ на: комментарий от Quasar 15.05.17 08:10:28 MSK

Вот только GPU сейчас жёстко сливает FPGA в этой задаче.

Да, они наверно сливают строго специализированным решениям в разы, что не удивительно. Но дело в том, что в играх будущего помимо расчета нейронной сети надо сделать много чего еще, что требует чип более общего назначения. Вы помните так называемые PPU? Специализированный чип для расчета графики. И где они сейчас? Я думаю та же самая судьба будет ожидать и специализированные чипы для расчета нейронок в играх. Это разумеется не касается исследовательских центров, где 99.9% вычислительного времени тратится на обучение этих сетей - там специализированные чипы очень даже приживутся и вытеснят все остальное.

Это уже шарлатанство. Для моделирования физики другие подходы требуются, а не нейросеть, так как тут надо не додумывать, а строго выполнять законы физики. А уж дорисовка... это уже виртуальная шизофрения.

Согласен, что шарлатанство. Но в играх обычно нет задачи «строго промоделировать законы физики». Есть задача - «создать видимость исполнения законов физики». Аналогично и с прорисовкой картины. Обычно нет задачи «строгого фотореализма», но есть задача «приблизительной прорисовки с приемлемым качеством и приемлемым fps».

EvgenijM86 ★
(15.05.17 12:42:15 MSK)

Ответ на: комментарий от EvgenijM86 15.05.17 12:42:15 MSK

Насчёт фотореализма в играх аффтар сделал всем очень смешно, поскольку не читал, что из себя представляли шейдеры и зачем они вообще были нужны.

dn2010 ★★★★★
(15.05.17 12:43:39 MSK)

Ссылка

то есть для более старых карт - фигу ? так ?

alwayslate ★★
(15.05.17 12:44:29 MSK)

Ссылка

Ответ на: комментарий от Deliverance 14.05.17 23:04:50 MSK

На ноутбуке A4 без дискретной видеокарты, KDE не лагает (Gnome не ставил пока), на десктопе RX 470 - ни Gnome, ни KDE не лагают.

ЧЯДНТ?

ishido ★
(15.05.17 12:44:51 MSK)

Ответ на: комментарий от EvgenijM86 15.05.17 12:42:15 MSK

PPU. Специализированный чип для расчета графики.

Перепутал. Для расчета физики.

EvgenijM86 ★
(15.05.17 12:46:33 MSK)

Ссылка

Ответ на: комментарий от dn2010 15.05.17 12:41:57 MSK

Специальные процессоры, предназначенные для нейросетей, на данном этапе развития это CUDA-ядра от nvidia, и очень редко робкие ростки чего-то другого.

Гугл еще чего-то разрабатывает. Так называемые TPU.

https://www.youtube.com/watch?v=BH-lOKfinDw

EvgenijM86 ★
(15.05.17 12:50:02 MSK)
Последнее исправление: EvgenijM86 15.05.17 12:50:40 MSK (всего исправлений: 1)

Ответ на: комментарий от EvgenijM86 15.05.17 12:50:02 MSK

Гугл еще чего-то разрабатывает. Так называемые TPU.

Гугл их, во-первых, никому не продаёт. А во-вторых, эти TPU умеют только целочисленные операции и годятся только гонять уже обученые нейросети, ибо для обучения надо считать градиенты. Гугл свои сети учит на тех же видеокартах от нвидии.

anonymous
(15.05.17 13:05:18 MSK)

Похожие темы