Не уверен что удобнее: своё адресное пространство и для проца, и для видео, или же общее. Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо.
>Не уверен что удобнее: своё адресное пространство и для проца, и для видео, или же общее. Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо.
Если ты поднимышь частоту памяти, поднимется латентность, что для CPU не приемлемо.
>>Не уверен что удобнее: своё адресное пространство и для проца, и для видео, или же общее. Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо.
>Если ты поднимышь частоту памяти, поднимется латентность, что для CPU не приемлемо.
Покажи свои высеры инженерам из nVidia, AMD или Intel, они хорошо посмеются. Заодно и спросишь у них почему у видеокарт наращивают частоту памяти, а у процессоров нет.
> Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо.
Это будет дорого.
Адрессное пространство физически тоже разное. Объедение в одно виртаульное пространство дает возможность переложить операции по работе с разными типами данных на контролер. что может хорошо сказаться на быстройдейсвии
>>Однако выровнять(к верхней границе :) скорость обмена данными между памятью и с процессором, и с видеокартой было бы неплохо.
>Это будет дорого.
Это просто требует времени) Несколько лет.
>Адрессное пространство физически тоже разное. Объедение в одно виртаульное пространство дает возможность переложить операции по работе с разными типами данных на контролер. что может хорошо сказаться на быстройдейсвии.
Дождёмся встроенных (в проц? работащих на одной шине?) графических конроллеров от Интела, АМД, почитаем документацию) Может за этим и будущее следущего десятилетия.
Да то что приложения не переписанные по cell работают со скоростью равночастотного pentium 4. А список задач, дающих реальный прирост не больше чем у CPGPU.
>Ребёнок, не засоряй эфир своими мечтами.
> Правда я слабо представляю как в системах с OpenCL реализован доступ к диску
очень просто реализован -- его там просто нет :)
> кинуть видеокарте набор бит и сказать что с ним сделать - не проблема.
Чего делать? dd кидает байты из одного места в другое, если ты каким-то хером еще это будешь пропускать через видеокарту, то производительность просядет в разы.
Возможность распараллеливания кода это необходимое условие того, чтобы он работал быстрее на видеокарте, но не достаточное.
>Возможность распараллеливания кода это необходимое условие того, чтобы он работал быстрее на видеокарте, но не достаточное.
Посоветуешь литературу по параллельным вычислениям? Желательно для начинающих. Хочу разобраться с возможностями оптимизации на современных системах(хотя документацию по CUDA я всегда смогу достать, было бы понятно что там происходит :).
В оптимизациях для cuda есть свои особенности, документации будет мало. Поэтому будь готов к тому, что если в лоб по документации писать, то тормозить у тебя всё будет.
Когда оно будет также просто использоваться как gcc, тогда да, будут. А пока это не очень хорошо. В лучшем случае у каждого видеопроизводителя свой инструментарий.
>Когда оно будет также просто использоваться как gcc, тогда да, будут. А пока это не очень хорошо. В лучшем случае у каждого видеопроизводителя свой инструментарий.