LINUX.ORG.RU

Ответ на: комментарий от linux4ever

> Ну так объясни как ты собираешься вешать на один кристалл два типа памяти, можешь со своей группой посоветоваться.

а вот это на фиг?

namezys ★★★★
()
Ответ на: комментарий от namezys

>Почему нельзя. Можно. Просто контролер памяти более мощьный ставить

Требования к памяти у CPU и GPU совершенно разные.

linux4ever
()
Ответ на: комментарий от namezys

Не обращай внимание, он фантазирует.

Не уверен что удобнее: своё адресное пространство и для проца, и для видео, или же общее. Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо.

wyldrodney
() автор топика
Ответ на: комментарий от wyldrodney

>Не уверен что удобнее: своё адресное пространство и для проца, и для видео, или же общее. Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо.

Если ты поднимышь частоту памяти, поднимется латентность, что для CPU не приемлемо.

linux4ever
()
Ответ на: комментарий от linux4ever

>Требования к памяти у CPU и GPU совершенно разные.

Сказал школьник, пару минут назад узнавший зачем видеокарте доступ к внешней, относительно себя, памяти.

wyldrodney
() автор топика
Ответ на: комментарий от linux4ever

>>Не уверен что удобнее: своё адресное пространство и для проца, и для видео, или же общее. Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо. >Если ты поднимышь частоту памяти, поднимется латентность, что для CPU не приемлемо.

Бгггг)))

wyldrodney
() автор топика
Ответ на: комментарий от wyldrodney

Покажи свои высеры инженерам из nVidia, AMD или Intel, они хорошо посмеются. Заодно и спросишь у них почему у видеокарт наращивают частоту памяти, а у процессоров нет.

linux4ever
()
Ответ на: комментарий от wyldrodney

> Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо.

Это будет дорого.

Адрессное пространство физически тоже разное. Объедение в одно виртаульное пространство дает возможность переложить операции по работе с разными типами данных на контролер. что может хорошо сказаться на быстройдейсвии

namezys ★★★★
()
Ответ на: комментарий от linux4ever

> Заодно и спросишь у них почему у видеокарт наращивают частоту памяти, а у процессоров нет.

На цену посмотри, детя мое. 1Гб памяти для видокарты стоит около 150$

при условии что к этомй памяти требования по сохраности данных ниже, чем у оперативной

латентность - это уже от типа памяти зависит. Я думаю процессор только обрадуется, если ему дать GDDR-5

namezys ★★★★
()
Ответ на: комментарий от namezys

>латентность - это уже от типа памяти зависит. Я думаю процессор только обрадуется, если ему дать GDDR-5

Что-то не слишком заметно, при увеличении частоты памяти в 2 раза, производительность вырастает на 5-10% от силы.

linux4ever
()
Ответ на: комментарий от namezys

>>Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо.

>Это будет дорого.

Это просто требует времени) Несколько лет.

>Адрессное пространство физически тоже разное. Объедение в одно виртаульное пространство дает возможность переложить операции по работе с разными типами данных на контролер. что может хорошо сказаться на быстройдейсвии.

Дождёмся встроенных (в проц? работащих на одной шине?) графических конроллеров от Интела, АМД, почитаем документацию) Может за этим и будущее следущего десятилетия.

wyldrodney
() автор топика
Ответ на: комментарий от linux4ever

>Мне насколько таймер ставить?

Ребёнок, не засоряй эфир своими мечтами.

wyldrodney
() автор топика
Ответ на: комментарий от linux4ever

> Это тот который без секса с кодом работает на уровне нетберстов?

А теперь по русски вырази свою мысль

namezys ★★★★
()
Ответ на: комментарий от namezys

>А теперь по русски вырази свою мысль

Да то что приложения не переписанные по cell работают со скоростью равночастотного pentium 4. А список задач, дающих реальный прирост не больше чем у CPGPU.

>Ребёнок, не засоряй эфир своими мечтами.


ПТУшница, в тебе еще много метана?

linux4ever
()
Ответ на: комментарий от linux4ever

> Да то что приложения не переписанные по cell работают со скоростью равночастотного pentium 4.

Ну если руки кривые - то да. У cell вообще-то одно обычное ядро. Хотя оно побыстрее пня 4, примерно на уровне ядра корки.

Кроме того, cell еще в векторный процессор вроде может объединяться (хотя смысла в этом не много)

> А список задач, дающих реальный прирост не больше чем у CPGPU.

Мда. О cell вы знаете не так и много. Хотя в общих чертах так и есть

namezys ★★★★
()
Ответ на: комментарий от namezys

>Хотя оно побыстрее пня 4, примерно на уровне ядра корки.

Летаете в своих мечтах. Там PPU не быстрее pIV, уже проверено многими людьми.

linux4ever
()
Ответ на: комментарий от namezys

>Хотя оно побыстрее пня 4, примерно на уровне ядра корки.

Летаете в своих мечтах. Там PPU не быстрее pIV, уже проверено многими людьми.

linux4ever
()
Ответ на: комментарий от namezys

>Мда. О cell вы знаете не так и много. Хотя в общих чертах так и есть

Что? Cell уже может стоят на вэб-сервере, быть процессором для баз данных.

Ладно. Тогда почему на МежДелМашовских кластерах используются оптероны параллельно с cell`ами?

linux4ever
()
Ответ на: комментарий от linux4ever

Посмотри что делала IBM из них. там оптероны использовались как контролерры ввода/вывода, и то их еле еле хватает, чтоб кормить CELL

namezys ★★★★
()
Ответ на: комментарий от wyldrodney

> Правда я слабо представляю как в системах с OpenCL реализован доступ к диску

очень просто реализован -- его там просто нет :)

> кинуть видеокарте набор бит и сказать что с ним сделать - не проблема.

Чего делать? dd кидает байты из одного места в другое, если ты каким-то хером еще это будешь пропускать через видеокарту, то производительность просядет в разы.

Возможность распараллеливания кода это необходимое условие того, чтобы он работал быстрее на видеокарте, но не достаточное.

Reset ★★★★★
()
Ответ на: комментарий от Reset

>если из процессора выковырять кеш, то разница будет видна

Естественно, но кэш никто не отнимает.

linux4ever
()
Ответ на: комментарий от Reset

>Возможность распараллеливания кода это необходимое условие того, чтобы он работал быстрее на видеокарте, но не достаточное.

Посоветуешь литературу по параллельным вычислениям? Желательно для начинающих. Хочу разобраться с возможностями оптимизации на современных системах(хотя документацию по CUDA я всегда смогу достать, было бы понятно что там происходит :).

wyldrodney
() автор топика
Ответ на: комментарий от namezys

>Посмотри что делала IBM из них. там оптероны использовались как контролерры ввода/вывода, и то их еле еле хватает, чтоб кормить CELL

Половина процессоров - I/O контроллеры? О_О. А что они там забыли? Целлов не хватает?

linux4ever
()
Ответ на: комментарий от wyldrodney

Начни для начала с алгоритмов. Какой нибудь простой книжечки, типа "алгоритмы, построение и анализ"

namezys ★★★★
()
Ответ на: комментарий от namezys

А почему не cell-only? Зачем межделмашу понадобились процессоры стороннего вендора?

linux4ever
()
Ответ на: комментарий от wyldrodney

> Посоветуешь литературу по параллельным вычислениям?

Я учился по этому http://www.ozon.ru/context/detail/id/2194562/ и этому http://www.ozon.ru/context/detail/id/153374/ ну и конечно по различным статьям.

В оптимизациях для cuda есть свои особенности, документации будет мало. Поэтому будь готов к тому, что если в лоб по документации писать, то тормозить у тебя всё будет.

Reset ★★★★★
()
Ответ на: комментарий от namezys

>Начни для начала с алгоритмов. Какой нибудь простой книжечки, типа "алгоритмы, построение и анализ"

Благодарю. Будет куда матан применить, пока не забыл окончательно.

wyldrodney
() автор топика
Ответ на: комментарий от wyldrodney

> Благодарю. Будет куда матан применить, пока не забыл окончательно.

воообще книжка понятная и хорошая

namezys ★★★★
()
Ответ на: комментарий от namezys

Похоже, она включает чуть больше, чем запрошенное параллельное программирование :) Тем не менее, многое пригодится для игрового ИИ.

Reset, также большое спасибо.

wyldrodney
() автор топика
Ответ на: комментарий от wyldrodney

Много, но по верхам.

Хотя таких верхова хватает на 99% задач по моему. После первого курса читается лекго. Сложно было ее в 10 классе читать

namezys ★★★★
()
Ответ на: комментарий от a3

> В линупсе видеодрова-то кое где и кое как работают, а тебе опенцл.

А когда на ати появилась CUDA? Если же кое-как работает нвидия то велика вероятность паталогической кривизны рук

DNA_Seq ★★☆☆☆
()

Когда оно будет также просто использоваться как gcc, тогда да, будут. А пока это не очень хорошо. В лучшем случае у каждого видеопроизводителя свой инструментарий.

ixrws ★★★
()
Ответ на: комментарий от ixrws

>Когда оно будет также просто использоваться как gcc, тогда да, будут. А пока это не очень хорошо. В лучшем случае у каждого видеопроизводителя свой инструментарий.

OpenCL работает даже над Intel Larabbee, емнип.

wyldrodney
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.