пересборка ядра с помощью CUDA

0

0

Оно же распрекрасно параллелится! Почему нет?

Ссылка

← Рекурсия + мемоизация =? Динамическое программирование

Определить пользователя, входящего в макс. число групп (shell) →

make и так прекрасно параллелится на несколько ядер. А gcc еще и распределяется через distcc на несколько машин.

~~anotheranonymous~~ ★
(02.05.10 01:29:58 MSK)

Ссылка

CUDA - не параллельная, а векторная машина.

Slackware-ch
(02.05.10 02:15:23 MSK)

Ответ на: комментарий от Slackware-ch 02.05.10 02:15:23 MSK

> CUDA - не параллельная, а векторная машина

Сударь, вы не в теме.

http://www.khronos.org/registry/cl/specs/opencl-1.0.48.pdf

fang ★
(02.05.10 03:12:07 MSK)

Ссылка

потому что ядро открытой системы не должно зависеть от проприетарных закрытых компонентов, к тому же нагрузка на процессор генерируемая непосредственно ядром - небольшая в сравнении с userspace

неперспективно

Sylvia ★★★★★
(02.05.10 03:21:07 MSK)

Ответ на: комментарий от Sylvia 02.05.10 03:21:07 MSK

> потому что ядро открытой системы не должно зависеть от проприетарных закрытых компонентов

OpenCL?

melkor217 ★★★★★
(02.05.10 03:32:40 MSK)

Ответ на: комментарий от melkor217 02.05.10 03:32:40 MSK

в случае NVidia их реализация открытого API все равно внутри закрыта, по сути обертка над cuda, как и OpenGL

Sylvia ★★★★★
(02.05.10 03:38:15 MSK)

Сохранение и переключение контекста... И всё не так прекрасно окажется, как кажется школьникам:)

Led ★★★☆☆
(02.05.10 03:38:40 MSK)

Ссылка

Ответ на: комментарий от Sylvia 02.05.10 03:38:15 MSK

> в случае NVidia их реализация открытого API все равно внутри закрыта, по сути обертка над cuda, как и OpenGL

если реализация сертефицирована - то ей можно доверять )

по крайней мере, можно будет смело предъявлять претензии

melkor217 ★★★★★
(02.05.10 03:45:14 MSK)

Ссылка

Ответ на: комментарий от Sylvia 02.05.10 03:21:07 MSK

я тока про пересборку, а не про работу ядра на GPU

~~darkshvein~~ ☆☆
(02.05.10 04:14:10 MSK) автор топика

Ответ на: комментарий от darkshvein 02.05.10 04:14:10 MSK

cuda-accelerated gcc ? идея интересна, но зачем ограничиваться только одним лишь ядром? может быть когда-нибудь и реализуют, а вообще хорошо бы если бы кто-то уже и наработки начал какие в этом плане...

Sylvia ★★★★★
(02.05.10 05:17:35 MSK)

Ссылка

Ответ на: комментарий от darkshvein 02.05.10 04:14:10 MSK

>я тока про пересборку, а не про работу ядра на GPU

тогда при чём тут «пересборка ядра»? Ядро с конфигом «всё включено» и так собирается меньше 15 минут на обычно домашнем десктопе.

Led ★★★☆☆
(02.05.10 05:43:34 MSK)

>пере
Может, проще ccache?

x3al ★★★★★
(02.05.10 05:47:34 MSK)

Ответ на: комментарий от x3al 02.05.10 05:47:34 MSK

>ccache

дает эффект только на идентичных файлах исходного кода
если собирать ядро несколько раз подряд - да
в остальных же случаях - бесполезная трата места на диске и обсчета контрольных сумм preprocessed source

Sylvia ★★★★★
(02.05.10 05:50:22 MSK)

Ссылка

Код на CUDA это не совсем C. В нём имеются некоторые указания относительно распределения вычислений по нитям. Кроме того код на CUDA очень архитектурно зависим. Иными словами всё это чушь. Пересобрать что-либо с помощью CUDA не возможно. Нужно переписать. Практически целиком. И это при том что смысл CUDA в том чтобы быстро выполнять множество операций с плавающей точкой.

KblCb ★★★★★
(02.05.10 13:25:45 MSK)

CUDA? Это ускоритель операций с плавающей точкой должен как-то помочь компилятору? %)

tailgunner ★★★★★
(02.05.10 13:38:30 MSK)

Ссылка

Потому, что CUDA реализует модель SIMD (одна инструкция, много данных). Например, есть параметр измеренный для 10^9 электронов, необходимо с помощью сложной формулы по этому параметру для каждого электрона вычислить другой параметр. Тогда CUDA подойдет.

При компиляции ядра задача совсем другая: MIMD (много инструкций, много данных). Так что компиляция на CUDA будет проходить даже медленнее, чем на 4-х ядерном CPU.

trex6 ★★★★★
(02.05.10 15:58:07 MSK)