LINUX.ORG.RU

Железо для «научных» вычислений.

 , ,


0

3

в железе полный ноль, как и во всем остальном.
но нужен комп для comsol, matlab и особенно openMP.
кажись число-дробилками такие компы называют.

на 2000 евро нужно вложиться в материнку, проц и RAM (до 16 GB DDR4?). все остальное по минимуму + SSD(256GB).
слышал о Intel Xeon (можно использовать 2 проца), ну и i7, но при этом только один проц.
есть какие идеи, советы?
о материнках знаю что есть asus и supermicro (но они кажись не подходят).

Deleted

mathlab c CUDA эффективно работает.

anto215 ★★
()

А если взять облачный сервис для вычислений? Самое-то бы вышло.

int13h ★★★★★
()

Насколько много тебе надо производительности? Какие объёмы числодробления? Режим работы? И да, я бы больше о GPU думал, для числодробления (хотя от характера задач зависит). Может что-то из профессионального GPU, где с плавающими числами погрешности поменьше.

peregrine ★★★★★
()
Последнее исправление: peregrine (всего исправлений: 1)

Вопрос в том не просядет ли производительность при более чем одном сокете.

dk-
()

Оперативной памяти добавь, если хочешь заниматься моделированием (comsol и т.д.). До 32, минимум.

tyakos ★★★
()
Ответ на: комментарий от peregrine

Насколько много тебе надо производительности?

в чем она меряется?
матлаб не сильно требователен.
комсол пока жрет до 10 Гб. по процессору чем быстрее тем лучше?
по openMP (шуршит 2-е суток на i5 с 4 core) это:

#pragma parallel for 
for (i=0; i<1e4; ++i)
{
    thread thr(function, parameter[i]);
    thr.join();
}

void function(parameter[i]) 
{
#pragma parallel for 
for (j=0; j<1e7; ++j) {
    new_function(parameter[i]);
}
это все запускается раз 5 на неделю.

Deleted
()
Ответ на: комментарий от tyakos

то что он любит память это видно.
32 это если 3D (пока в нем не нуждаюсь) или параметрические исчисления.
это такое, что можно всегда добавить.

Deleted
()
Ответ на: комментарий от peregrine

если то, что соберу, оправдает себя за год, дальше будет финансирование на xeon phi.
на GPU смотрю сквозь пальцы.
но это все не то!
вопрос в теме не о GPU и других вещях.

Deleted
()

ASUS ROG RAMPAGE V EDITION 10 [600]
Intel Core i7 6900K - 3.2 GHz - 8-Core - 16 Threads - 20 MB Cache [1200]
G.Skill Ripjaws V - DDR4 - 16 GB : 2 x 8 GB - DIMM 288-PIN - 3200 MHz / PC4-25600 [120]

vs

SUPERMICRO X10DRI-LN4+ [600]
Intel Xeon E5-2650V3 - 2.3 GHz - 10-Core - 20 Threads - 25 MB [1200]
G.Skill Ripjaws V - DDR4 - 16 GB : 2 x 8 GB - DIMM 288-PIN - 3200 MHz / PC4-25600 [120]

vs

SUPERMICRO X10DRI-LN4+ [600]
Intel Xeon E5-2650V3 - 2.3 GHz - 10-Core - 20 Threads - 25 MB [1200]
G.Skill Ripjaws V - DDR4 - 16 GB : 2 x 8 GB - DIMM 288-PIN - 3200 MHz / PC4-25600 [120]
2 X Intel Xeon E5-1650V3 - 3.5 GHz - 6-Core - 12 Threads - 15 MB [2 x 700]

Deleted
()
Ответ на: комментарий от Deleted

На мой дилетантский взгляд, вариант №2. Но памяти я бы добавил. Никогда не знаешь, когда захочешь запустить модель побольше. Тем более, она стоит мало, по сравнению с другими компонентами.

tyakos ★★★
()

Как софт по количеству потоков масштабируется против их скорости?

i7-6950X+самая дешёвая мать будет быстрее твоих вариантов.

anonymous
()

тоже ничего не понимать,
но тесты лолоклокеров говорят что i7 ****K имеют самые быстрые ядра.

Deleted
()
Ответ на: комментарий от anonymous

но нужен комп для comsol, matlab и особенно openMP.

Но все всё про софт знают лучше ТС.

greenman ★★★★★
()
Последнее исправление: greenman (всего исправлений: 1)

Если собираешься считать сутками, то кмк имеет смысл брать память ECC (соответственно, процессор и матплату с его поддержкой).

Знакомый хотел сэкономить и задействовал небольшой самодельный кластер из машин компьютерного класса в институте во время каникул. Считал что-то полуинженерное по распределению поля в волноводах, занимало 1-2 суток. В результате из-за ошибок памяти у него часто была каша вместо результатов.

Я не говорю, что у тебя такое точно будет (не особо в курсе comsol; в каких-нибудь методах частиц наверн можно забить), но задуматься стоит. Почитай про вероятности ошибок оперативной памяти.

lu4nik ★★★
()

Всё сильно зависит от задач. Но если есть матричные вычисления в большом кол-ве - нужна CUDA на видеокарте (OpenCL довольно плохо поддерживается сейчас в прикладных либах, поэтому AMD потребует дополнительных вложений работы в код).

На мой взгляд - бери i7 без индекса K (К процы это для оверклокеров, вы же гнать его не будете, чтобы ресурс не убить) или Xeon влазащий по деньгам. 16 Gb DDR4 от Samsung или Kingston двумя плашками по 8 Гб. Мать - что-то из среднего ценового диапазона (а не какой-то Rampage, как советует идиот выше, Rampage это для разгонов и понтов, тебе не нужно).

По деньгам считай так, чтобы осталось где-то 20к рублей на 1060 с 6 Гб памяти, если сможешь уложиться в меньший бюджет на проц+мать+память, то беги 1070 (30к)\1080 (50к).

P.S. Не забывай, что под нагрузки тебе нужен качественный блок питания + не стоковый кулер на проц.

Norgat ★★★★★
()
Ответ на: комментарий от Norgat

Чтобы задейчтвовать полностью 4x канальный контроллер памяти нужно 4 планки. Алсо ты ОПа идиотом назвал))

anonymous
()
Ответ на: комментарий от Norgat

И ещё: у -K процев выше частоты с завода, их не обязательно гнать.

anonymous
()
Ответ на: комментарий от anonymous

Я сказал правду. Две планки - через год ему 16 перестанет хватать (или раньше).

Про k процы - ему видеокарта будет на порядок полезнее чем k проц. Я сравнивал dgemm на своих i5 4670k и r9 290 - gpu на порядок больше производительности выдает в ViennaCL.

Norgat ★★★★★
()
Ответ на: комментарий от Deleted

ядра всего 4, а прагм натыкал во все циклы. это во-первых. а во-вторых, зачем тебе тут потоки, если ты используешь openmp? а join ты тут поставил потому, что без него всё вообще тормозит, да?

а что в функции? сколько там ещё вложенных циклов?

anonymous
()
Ответ на: комментарий от Deleted

а simd используешь? а то может забесплатно можно раза в 4 ускориться.

anonymous
()
Ответ на: комментарий от Deleted

Вусрачку разогнанную память для вычислений брать нельзя.

Два проца можно брать только если знаешь что такое NUMA.

steemandlinux ★★★★★
()

ок. прочитав все сообщения, можно сделать вывод (который большинство посчитает неправильным?) что:

SUPERMICRO X10DRI-LN4+ [600]
Intel Xeon E5-2650V3 - 2.3 GHz - 10-Core - 20 Threads - 25 MB [1200]
Kingston ValueRAM - DDR4 - 32 GB : 4 x 8 GB - DIMM 288-PIN - 2133 MHz / PC4-17000 - CL15 - 1.2 V - ECC [300]

это лучший вариант за такую цену.
RAM с ECC и частотой 2133, что бы не было ошибок.
2-х процесорная мамка, с одним процом же работать будет? потом прикупиться другой если что.
так никто не ответил. i7 в паре работать умеют? или только Xeon?

Deleted
()
Ответ на: комментарий от steemandlinux

Вусрачку разогнанную память для вычислений брать нельзя.

на счет RAM понял, исправил.

Два проца можно брать только если знаешь что такое NUMA.

ну у нас стоят два компа с процами xeon.
никто не знает что такое NUMA, но они работают, и пошутрее остальных.

Deleted
()
Ответ на: комментарий от Deleted

Два зеона на одной материнке стоит? Неправильно написанный код на них будет конкретно тупить. Между контроллерами памяти процессоров не должно быть большого обмена данными.

steemandlinux ★★★★★
()
Ответ на: комментарий от steemandlinux

да. 2. на них стоит оффтопик. matlab с comsol. и им уже более 5 лет.
openMP matlab с comsol только на ноуте i5 и openMP на кластере. но кластер это очередь, всегда по Х задач крутится и так далее.
повторюсь. собираем железо.
кривые руки для кодинга не обговариваются. хотя они перечеркивают все преимущества железа.

последняя комплектация нормальная? ничего не противоречит в сборке?

Deleted
()
Ответ на: комментарий от Deleted

Комплектация нормальная, мамка с одним процом работать будет, не будут работать некоторые разъемы на ней.

steemandlinux ★★★★★
()

Зависит от задачи, но Xeon Phi — отстой, GPU, в принципе, тоже. Бери Intel Xeon, и твои волосы будут гладкими и шелковистыми

Sahas ★★★★☆
()
Ответ на: комментарий от Deleted

ничего не хочется переписывать.
openMP схватит автоматом GPU? без перезаписи кода? если да. можно всунуть.
но насколько я знаю, не подхватывает.

matlab c comsole - им хватит и того, что предложено.

Deleted
()

все. тема закрыта. спасибо всем за участие.

Deleted
()

ИМХО дельные советы. Супермикро хоть и дороже иногда чем другие платформы, но у неё заточенность именно под серверы и числодробилки. Основное правило по железу для научных вычислений: памяти много не бывает. И если это многосуточные задачи, то память только ECC. А дальше частности: поддаются расчёты GPU - смотри видеокарты или сопроцессор типа xeon Phi.

Конкретно на год: возьми память ECC. Думаю, при ограничении в 2 тысячи евро на 32 гига денег не хватит.

Stalin ★★★★★
()
Ответ на: комментарий от Deleted

Есть Xeon E5-2650v4. Цена такая же как у v3, но на 2 ядра и 5 MB кеша больше.

iliyap ★★★★★
()
Ответ на: комментарий от intelfx

Не увидел для clBLAS бенчмарков сравнения CPU и GPU (у ViennaCL они есть). Писать сейчас самому - нет времени и желания (я использую OpenCL как бекэнд для пары операций с матрицами и в чистый BLAS не лезу просто).

Norgat ★★★★★
()

А не проще ли пошуршать по барахолкам и найти ноду какого-нибудь старого кластера?

ZERG ★★★★★
()
Ответ на: комментарий от ZERG

может и проще и дешевле.
но, по барахолкам можно официально что-то протянуть?
да и объяснить начальству будет тяжело, не поймут.

с последнего:
Stalin все правильно подчеркнул,
а iliyap посоветовал получше проц.

Deleted
()
Ответ на: комментарий от anonymous

бюджет резиновый.
себя ограничил суммой, указанной выше.
за ~7000, наверное, проще взять Xeon Phi? не так ли?

Deleted
()
Ответ на: комментарий от Deleted

ну и нахрена десктопную говнопамять с гламурными радиаторами, погнанную по самое нехочу, на серверные платы пытаться втулить? все равно с большой вероятностью не заработает вообще, а если заработает - то на низких частотах...

NiTr0 ★★★★★
()
Ответ на: комментарий от Deleted

Гм.

А тебе точно нужен серверный вариант?

Минусы:
1. память специфичная, просто пойти в магаз и купить не получится
2. NUMA — снижение производительности, или придется прогать с учетом железа...
3. Серверные материнки не супер с т.з. втыкания нескольких GPU (матлаб на них действительно неплохо считает)
...

Я бы предложил рассмотреть стандартный вариант с хорошим core i7 и обычной материнкой на 128Gb DDR4.

Если мощности не хватит, то купить еще один (два, три,...) точно такой же. Если, конечно, у тебя задачи позволяют распределять вычисления.

soomrack ★★★★
()
Ответ на: комментарий от Deleted

Всё таки у phi своя специфика, оно заточено под использование avx512. А то обычный проц.

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.