Выбор железа для числодробилки

0

5

Дамы и господа, я был бы очень признателен за совет, какую конфигурацию лучше выбрать для рабочей станции.

Несколько слов о задаче. Я ищу основное состояние гамильтониана, который соответствует довольно большой матрице, грубо говоря, миллион на миллион элементов. В память такая матрица не влезет, поэтому я ищу собственные векторы с помощью модифицированного метода Ланцоша. Каждая его итерация вычисляет действие H на \Psi, а для этого помнить всю матрицу необязательно. Достаточно по мере необходимости вычислять матричные элементы H_{ij} при суммировании H_{ij} \Psi_{j}. Каждую i-ю координату вектора H\Psi можно считать отдельно, на своем ядре, то есть задача хорошо распараллеливается. Поэтому я ищу многоядерную конфигурацию. Задача решается в Mathematica под openSUSE. Важно, чтобы Linux хорошо поддерживал мою платформу.

Я присмотрел такую (приемлемую по цене) конфигурацию:

2 процессора Opteron 6272 (16 ядер каждый) + материнка Asus KGPE-D16, 16 планок памяти по 8 Гб.

Как вы думаете, хороший ли это выбор? Я сомневаюсь, уж не стоит ли посмотреть в сторону предыдущего поколения Оптеронов 6100, у которых ядер всего 12, но честных (на каждое ядро свой блок FPU). Также не знаю, хорошо ли работает эта плата Асус под Линуксом, но, в отличие от виденных мной Supermicro и Tyan, у нее на борту 6 SATA портов, а у меня как раз массив на SATA.

Ссылка

← Linux и встроенный hdmi какие подводные камни?

проектор через HDMI отдельным рабочим столом →

← 1 2 →

Ответ на: комментарий от GAMer 19.04.12 11:39:07 MSK

Понятно, спасибо. С другой стороны, у 680 шейдеров в три раза больше, ченм у 580 (1500 против 500), что с точки зрения параллелизации выглядит плюсом.

~~SlonoInquisitor~~ ★
(19.04.12 11:45:13 MSK) автор топика

Ответ на: комментарий от SlonoInquisitor 19.04.12 11:45:13 MSK

Ну как там считаются «процессоры» я не в курсе, у 7970 их вообще 2048 =)
Но подозреваю, что счёт ведётся только по ALU/FPU, что о реальной производительности скажет немного.
А вот по той ссылке на нв форуме жалуются на урезку у 680 всех кэшей, так что надо думать, хватить ли памяти кормить ядра данными.
Ну и «Limitations in the compile-time scheduling of instructions resulting in _underutilized_ CUDA cores.»

GAMer ★★★★★
(19.04.12 12:06:59 MSK)

Ответ на: комментарий от GAMer 19.04.12 12:06:59 MSK

Да. Начинаешь задумываться о 7970 и openCL.

~~SlonoInquisitor~~ ★
(19.04.12 12:11:21 MSK) автор топика

Ответ на: комментарий от Kompilainenn 19.04.12 10:43:25 MSK

http://www.nvidia.ru/page/personal_computing.html походи по ссылкам ниже и поработай в конфигураторах.

AlexVR ★★★★★
(19.04.12 13:58:15 MSK)

Ссылка

Ответ на: комментарий от SlonoInquisitor 19.04.12 12:11:21 MSK

Да. Начинаешь задумываться о 7970 и openCL.

Чушь. Преимущество CUDA не большей производительности, а в наличии большого набора реальных библиотек, который позволяют программировать научные вычисления даже не крутым программистам.

Чего только стоит Thrust

AlexVR ★★★★★
(19.04.12 14:04:56 MSK)

Ответ на: комментарий от GAMer 19.04.12 11:39:07 MSK

Народ там уже смотрит на АМД, у которых не так все шоколадно с софтом, но хорошо сбалансировано по производительности на $.

И кому нужны эти АМД? Если пишется видеокодек, то ещё имеет смысл долбаться на чистом OpenCL. Но если тебе надо написать приложение считающую конкретную задачу быстро и сейчас, то надо быть упоротым, чтобы выбрать OpenCL вместо CUDA с её оравой готовых библиотек.

AlexVR ★★★★★
(19.04.12 14:09:44 MSK)