Кто-то уже переписывает GNU-окружение, Xorg и Qt на OpenCL/CUDA?

Ответ на: комментарий от linux4ever 11.11.09 09:45:13 MSK

> Ну так объясни как ты собираешься вешать на один кристалл два типа памяти, можешь со своей группой посоветоваться.

а вот это на фиг?

namezys ★★★★
(11.11.09 10:06:47 MSK)

Ответ на: комментарий от namezys 11.11.09 10:05:23 MSK

>Почему нельзя. Можно. Просто контролер памяти более мощьный ставить

Требования к памяти у CPU и GPU совершенно разные.

~~linux4ever~~
(11.11.09 10:10:53 MSK)

Ответ на: комментарий от namezys 11.11.09 10:06:47 MSK

Не обращай внимание, он фантазирует.

Не уверен что удобнее: своё адресное пространство и для проца, и для видео, или же общее. Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо.

wyldrodney ☆
(11.11.09 10:11:23 MSK) автор топика

Ответ на: комментарий от wyldrodney 11.11.09 10:11:23 MSK

>Не уверен что удобнее: своё адресное пространство и для проца, и для видео, или же общее. Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо.

Если ты поднимышь частоту памяти, поднимется латентность, что для CPU не приемлемо.

~~linux4ever~~
(11.11.09 10:12:16 MSK)

Ответ на: комментарий от linux4ever 11.11.09 10:10:53 MSK

>Требования к памяти у CPU и GPU совершенно разные.

Сказал школьник, пару минут назад узнавший зачем видеокарте доступ к внешней, относительно себя, памяти.

wyldrodney ☆
(11.11.09 10:12:42 MSK) автор топика

Ответ на: комментарий от linux4ever 11.11.09 10:12:16 MSK

>>Не уверен что удобнее: своё адресное пространство и для проца, и для видео, или же общее. Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо. >Если ты поднимышь частоту памяти, поднимется латентность, что для CPU не приемлемо.

Бгггг)))

wyldrodney ☆
(11.11.09 10:13:19 MSK) автор топика

Ответ на: комментарий от wyldrodney 11.11.09 10:12:42 MSK

Покажи свои высеры инженерам из nVidia, AMD или Intel, они хорошо посмеются. Заодно и спросишь у них почему у видеокарт наращивают частоту памяти, а у процессоров нет.

~~linux4ever~~
(11.11.09 10:17:38 MSK)

Ответ на: комментарий от wyldrodney 11.11.09 10:13:19 MSK

Бгггг))) *Характерный звук слива воды из унитаза*

~~linux4ever~~
(11.11.09 10:18:10 MSK)

Ссылка

Ответ на: комментарий от wyldrodney 11.11.09 10:11:23 MSK

> Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо.

Это будет дорого.

Адрессное пространство физически тоже разное. Объедение в одно виртаульное пространство дает возможность переложить операции по работе с разными типами данных на контролер. что может хорошо сказаться на быстройдейсвии

namezys ★★★★
(11.11.09 10:21:10 MSK)

Ответ на: комментарий от linux4ever 11.11.09 10:17:38 MSK

> Заодно и спросишь у них почему у видеокарт наращивают частоту памяти, а у процессоров нет.

На цену посмотри, детя мое. 1Гб памяти для видокарты стоит около 150$

при условии что к этомй памяти требования по сохраности данных ниже, чем у оперативной

латентность - это уже от типа памяти зависит. Я думаю процессор только обрадуется, если ему дать GDDR-5

namezys ★★★★
(11.11.09 10:23:10 MSK)

Ответ на: комментарий от namezys 11.11.09 10:23:10 MSK

>латентность - это уже от типа памяти зависит. Я думаю процессор только обрадуется, если ему дать GDDR-5

Что-то не слишком заметно, при увеличении частоты памяти в 2 раза, производительность вырастает на 5-10% от силы.

~~linux4ever~~
(11.11.09 10:25:12 MSK)

Ответ на: комментарий от namezys 11.11.09 10:21:10 MSK

>>Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо.

>Это будет дорого.

Это просто требует времени) Несколько лет.

>Адрессное пространство физически тоже разное. Объедение в одно виртаульное пространство дает возможность переложить операции по работе с разными типами данных на контролер. что может хорошо сказаться на быстройдейсвии.

Дождёмся встроенных (в проц? работащих на одной шине?) графических конроллеров от Интела, АМД, почитаем документацию) Может за этим и будущее следущего десятилетия.

wyldrodney ☆
(11.11.09 10:30:15 MSK) автор топика

Ответ на: комментарий от wyldrodney 11.11.09 10:30:15 MSK

Ждем, ждем GPU+CPU такой же быстрый как CPU + GPU Card.

Мне насколько таймер ставить?

~~linux4ever~~
(11.11.09 10:32:38 MSK)

Ответ на: комментарий от linux4ever 11.11.09 10:32:38 MSK

> Мне насколько таймер ставить?

можешь уже снимать. читай что такое CELL

namezys ★★★★
(11.11.09 10:37:53 MSK)

Ответ на: комментарий от namezys 11.11.09 10:37:53 MSK

Это тот который без секса с кодом работает на уровне нетберстов?

~~linux4ever~~
(11.11.09 10:39:18 MSK)

Ответ на: комментарий от linux4ever 11.11.09 10:32:38 MSK

>Мне насколько таймер ставить?

Ребёнок, не засоряй эфир своими мечтами.

wyldrodney ☆
(11.11.09 10:40:23 MSK) автор топика

Ссылка

Ответ на: комментарий от linux4ever 11.11.09 10:39:18 MSK

> Это тот который без секса с кодом работает на уровне нетберстов?

А теперь по русски вырази свою мысль

namezys ★★★★
(11.11.09 10:40:46 MSK)

Ответ на: комментарий от namezys 11.11.09 10:40:46 MSK

>А теперь по русски вырази свою мысль

Да то что приложения не переписанные по cell работают со скоростью равночастотного pentium 4. А список задач, дающих реальный прирост не больше чем у CPGPU.

>Ребёнок, не засоряй эфир своими мечтами.

ПТУшница, в тебе еще много метана?

~~linux4ever~~
(11.11.09 10:43:58 MSK)

Ответ на: комментарий от linux4ever 11.11.09 10:43:58 MSK

> Да то что приложения не переписанные по cell работают со скоростью равночастотного pentium 4.

Ну если руки кривые - то да. У cell вообще-то одно обычное ядро. Хотя оно побыстрее пня 4, примерно на уровне ядра корки.

Кроме того, cell еще в векторный процессор вроде может объединяться (хотя смысла в этом не много)

> А список задач, дающих реальный прирост не больше чем у CPGPU.

Мда. О cell вы знаете не так и много. Хотя в общих чертах так и есть

namezys ★★★★
(11.11.09 10:47:02 MSK)

Ответ на: комментарий от namezys 11.11.09 10:47:02 MSK

>Хотя оно побыстрее пня 4, примерно на уровне ядра корки.

Летаете в своих мечтах. Там PPU не быстрее pIV, уже проверено многими людьми.

~~linux4ever~~
(11.11.09 10:50:04 MSK)

Ссылка

Ответ на: комментарий от namezys 11.11.09 10:47:02 MSK

>Хотя оно побыстрее пня 4, примерно на уровне ядра корки.

Летаете в своих мечтах. Там PPU не быстрее pIV, уже проверено многими людьми.

~~linux4ever~~
(11.11.09 10:52:16 MSK)

Ссылка

Ответ на: комментарий от namezys 11.11.09 10:47:02 MSK

>Мда. О cell вы знаете не так и много. Хотя в общих чертах так и есть

Что? Cell уже может стоят на вэб-сервере, быть процессором для баз данных.

Ладно. Тогда почему на МежДелМашовских кластерах используются оптероны параллельно с cell`ами?

~~linux4ever~~
(11.11.09 10:53:35 MSK)

Ответ на: комментарий от linux4ever 11.11.09 10:53:35 MSK

Посмотри что делала IBM из них. там оптероны использовались как контролерры ввода/вывода, и то их еле еле хватает, чтоб кормить CELL

namezys ★★★★
(11.11.09 11:09:44 MSK)

Ответ на: комментарий от wyldrodney 11.11.09 09:13:31 MSK

> Правда я слабо представляю как в системах с OpenCL реализован доступ к диску

очень просто реализован -- его там просто нет :)

> кинуть видеокарте набор бит и сказать что с ним сделать - не проблема.

Чего делать? dd кидает байты из одного места в другое, если ты каким-то хером еще это будешь пропускать через видеокарту, то производительность просядет в разы.

Возможность распараллеливания кода это необходимое условие того, чтобы он работал быстрее на видеокарте, но не достаточное.

Reset ★★★★★
(11.11.09 11:16:32 MSK)

Ответ на: комментарий от linux4ever 11.11.09 10:25:12 MSK

если из процессора выковырять кеш, то разница будет видна

Reset ★★★★★
(11.11.09 11:20:53 MSK)

Ответ на: комментарий от Reset 11.11.09 11:20:53 MSK

>если из процессора выковырять кеш, то разница будет видна

Естественно, но кэш никто не отнимает.

~~linux4ever~~
(11.11.09 11:21:42 MSK)

Ссылка

Ответ на: комментарий от Reset 11.11.09 11:16:32 MSK

>Возможность распараллеливания кода это необходимое условие того, чтобы он работал быстрее на видеокарте, но не достаточное.

Посоветуешь литературу по параллельным вычислениям? Желательно для начинающих. Хочу разобраться с возможностями оптимизации на современных системах(хотя документацию по CUDA я всегда смогу достать, было бы понятно что там происходит :).

wyldrodney ☆
(11.11.09 11:24:52 MSK) автор топика

Ответ на: комментарий от namezys 11.11.09 11:09:44 MSK

>Посмотри что делала IBM из них. там оптероны использовались как контролерры ввода/вывода, и то их еле еле хватает, чтоб кормить CELL

Половина процессоров - I/O контроллеры? О_О. А что они там забыли? Целлов не хватает?

~~linux4ever~~
(11.11.09 11:25:01 MSK)

Ответ на: комментарий от wyldrodney 11.11.09 11:24:52 MSK

Начни для начала с алгоритмов. Какой нибудь простой книжечки, типа "алгоритмы, построение и анализ"

namezys ★★★★
(11.11.09 11:25:47 MSK)

Ответ на: комментарий от linux4ever 11.11.09 11:25:01 MSK

Cell занят вычислением

namezys ★★★★
(11.11.09 11:26:09 MSK)

Ответ на: комментарий от namezys 11.11.09 11:26:09 MSK

А почему не cell-only? Зачем межделмашу понадобились процессоры стороннего вендора?

~~linux4ever~~
(11.11.09 11:27:49 MSK)

Ссылка

Ответ на: комментарий от wyldrodney 11.11.09 11:24:52 MSK

> Посоветуешь литературу по параллельным вычислениям?

Я учился по этому http://www.ozon.ru/context/detail/id/2194562/ и этому http://www.ozon.ru/context/detail/id/153374/ ну и конечно по различным статьям.

В оптимизациях для cuda есть свои особенности, документации будет мало. Поэтому будь готов к тому, что если в лоб по документации писать, то тормозить у тебя всё будет.

Reset ★★★★★
(11.11.09 11:32:38 MSK)

Ссылка

Ответ на: комментарий от namezys 11.11.09 11:25:47 MSK

>Начни для начала с алгоритмов. Какой нибудь простой книжечки, типа "алгоритмы, построение и анализ"

Благодарю. Будет куда матан применить, пока не забыл окончательно.

wyldrodney ☆
(11.11.09 11:33:02 MSK) автор топика

Ответ на: комментарий от wyldrodney 11.11.09 11:33:02 MSK

> Благодарю. Будет куда матан применить, пока не забыл окончательно.

воообще книжка понятная и хорошая

namezys ★★★★
(11.11.09 11:52:03 MSK)

Ответ на: комментарий от namezys 11.11.09 11:52:03 MSK

Похоже, она включает чуть больше, чем запрошенное параллельное программирование :) Тем не менее, многое пригодится для игрового ИИ.

Reset, также большое спасибо.

wyldrodney ☆
(11.11.09 12:02:00 MSK) автор топика

Ответ на: комментарий от wyldrodney 11.11.09 12:02:00 MSK

Много, но по верхам.

Хотя таких верхова хватает на 99% задач по моему. После первого курса читается лекго. Сложно было ее в 10 классе читать

namezys ★★★★
(11.11.09 12:04:55 MSK)

Ссылка

Ответ на: комментарий от a3 11.11.09 05:31:52 MSK

> В линупсе видеодрова-то кое где и кое как работают, а тебе опенцл.

А когда на ати появилась CUDA? Если же кое-как работает нвидия то велика вероятность паталогической кривизны рук

DNA_Seq ★★☆☆☆
(11.11.09 13:28:48 MSK)

Ссылка

Когда оно будет также просто использоваться как gcc, тогда да, будут. А пока это не очень хорошо. В лучшем случае у каждого видеопроизводителя свой инструментарий.

~~ixrws~~ ★★★
(11.11.09 15:16:01 MSK)

Ответ на: комментарий от ixrws 11.11.09 15:16:01 MSK

>Когда оно будет также просто использоваться как gcc, тогда да, будут. А пока это не очень хорошо. В лучшем случае у каждого видеопроизводителя свой инструментарий.

OpenCL работает даже над Intel Larabbee, емнип.

wyldrodney ☆
(11.11.09 15:34:09 MSK) автор топика

Ссылка

Похожие темы