LINUX.ORG.RU

Выбор железа для числодробилки


0

5

Дамы и господа, я был бы очень признателен за совет, какую конфигурацию лучше выбрать для рабочей станции.

Несколько слов о задаче. Я ищу основное состояние гамильтониана, который соответствует довольно большой матрице, грубо говоря, миллион на миллион элементов. В память такая матрица не влезет, поэтому я ищу собственные векторы с помощью модифицированного метода Ланцоша. Каждая его итерация вычисляет действие H на \Psi, а для этого помнить всю матрицу необязательно. Достаточно по мере необходимости вычислять матричные элементы H_{ij} при суммировании H_{ij} \Psi_{j}. Каждую i-ю координату вектора H\Psi можно считать отдельно, на своем ядре, то есть задача хорошо распараллеливается. Поэтому я ищу многоядерную конфигурацию. Задача решается в Mathematica под openSUSE. Важно, чтобы Linux хорошо поддерживал мою платформу.

Я присмотрел такую (приемлемую по цене) конфигурацию:

2 процессора Opteron 6272 (16 ядер каждый) + материнка Asus KGPE-D16, 16 планок памяти по 8 Гб.

Как вы думаете, хороший ли это выбор? Я сомневаюсь, уж не стоит ли посмотреть в сторону предыдущего поколения Оптеронов 6100, у которых ядер всего 12, но честных (на каждое ядро свой блок FPU). Также не знаю, хорошо ли работает эта плата Асус под Линуксом, но, в отличие от виденных мной Supermicro и Tyan, у нее на борту 6 SATA портов, а у меня как раз массив на SATA.

Ответ на: комментарий от GAMer

Понятно, спасибо. С другой стороны, у 680 шейдеров в три раза больше, ченм у 580 (1500 против 500), что с точки зрения параллелизации выглядит плюсом.

SlonoInquisitor
() автор топика
Ответ на: комментарий от SlonoInquisitor

Ну как там считаются «процессоры» я не в курсе, у 7970 их вообще 2048 =)
Но подозреваю, что счёт ведётся только по ALU/FPU, что о реальной производительности скажет немного.
А вот по той ссылке на нв форуме жалуются на урезку у 680 всех кэшей, так что надо думать, хватить ли памяти кормить ядра данными.
Ну и «Limitations in the compile-time scheduling of instructions resulting in _underutilized_ CUDA cores.»

GAMer ★★★★★
()
Ответ на: комментарий от SlonoInquisitor

Да. Начинаешь задумываться о 7970 и openCL.

Чушь. Преимущество CUDA не большей производительности, а в наличии большого набора реальных библиотек, который позволяют программировать научные вычисления даже не крутым программистам.

Чего только стоит Thrust

AlexVR ★★★★★
()
Ответ на: комментарий от GAMer

Народ там уже смотрит на АМД, у которых не так все шоколадно с софтом, но хорошо сбалансировано по производительности на $.

И кому нужны эти АМД? Если пишется видеокодек, то ещё имеет смысл долбаться на чистом OpenCL. Но если тебе надо написать приложение считающую конкретную задачу быстро и сейчас, то надо быть упоротым, чтобы выбрать OpenCL вместо CUDA с её оравой готовых библиотек.

AlexVR ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.