pdsyev ругается с вычислительной сеткой 1x4 (2x2 - в норме)

blacs, lapack, mpi, pblas, scalapack

0

2

Есть пример использования pdsyev. После указанной правки всё работает.

Но при изменении конфигурации сетки:

было: матрица 4x4, процессы: 2x2, т.е. каждый процесс получает 2x2-кусок матрицы (prow=2; pcol=2; brow=2; bcol=2;).

пробую: матрица 4x4, процессы: 1x4, т.е. каждый процесс получает 4x1-кусок матрицы (prow=1; pcol=4; brow=4; bcol=1;).

pdsyev кричит, что невалиден параметр 709 (или около того).

Похоже, нужно ещё где-то крутить, но не вижу где.

P.S. Кстати, а в удобных пакетах типа octave, scilab,... имеется поддержка распределённых вычислений? А то от libscalapack-mpi1 у меня в дебиане что-то почти ничего не зависит. Да и гугл недавно открыл код алгортима для их карт, так он использует не lapack, а eugen.

Ссылка

←	PCI - выделение DMA памяти

Утечка памяти?

→

И scilab, и octave могут использовать lapack для вычислений.

keyran ★★
(13.05.12 00:49:00 MSK)

Ответ на: комментарий от keyran 13.05.12 00:49:00 MSK

распределённых вычислений?

для вычислений

gag ★★★★★
(13.05.12 00:58:33 MSK) автор топика

Ссылка

в дебиане есть теперь упакованный openblas или надо именно mpi?

psv1967 ★★★★★
(13.05.12 01:19:44 MSK)

Ответ на: комментарий от psv1967 13.05.12 01:19:44 MSK

Такого ещё не встречал, спасибо за инфо («Unlike Atlas, OpenBLAS provides a multiple architecture library», но под amd64 им пока не удалось 0.1.0 собрать).

В контексте вопроса мне интересны именно параллельные варианты.

gag ★★★★★
(13.05.12 02:14:16 MSK) автор топика

Ответ на: комментарий от gag 13.05.12 02:14:16 MSK

atlas умеет openmp и на blas level 3 выдает количество gflops почти в точном соответствии со спецификациями процессора :)

Reset ★★★★★
(13.05.12 02:21:15 MSK)

Ответ на: комментарий от gag 13.05.12 02:14:16 MSK

openblas из репов у меня собрался именно на амд, или я чего то не понимаю?

psv1967 ★★★★★
(14.05.12 13:39:21 MSK)

Ответ на: комментарий от Reset 13.05.12 02:21:15 MSK

ну и как атлас?39? или как его там, именно в дебиане поиметь?

psv1967 ★★★★★
(14.05.12 13:40:25 MSK)

Ссылка

Ответ на: комментарий от psv1967 14.05.12 13:39:21 MSK

Тогда можно обрадовать дебианщиков, потому что у них 0.1.0 только для i386 собран.

Тем временем, обнаружил подозрительный комментарий в pdsyev.f

*  Alignment requirements
*  ======================
*
*  The distributed submatrices A(IA:*, JA:*) and Z(IZ:IZ+M-1,JZ:JZ+N-1)
*  must verify some alignment properties, namely the following
*  expressions should be true:
*
*  ( MB_A.EQ.NB_A.EQ.MB_Z .AND. IROFFA.EQ.IROFFZ .AND. IROFFA.EQ.0 .AND.
*    IAROW.EQ.IZROW )
*  where
*  IROFFA = MOD( IA-1, MB_A ) and ICOFFA = MOD( JA-1, NB_A ).

Т.е. brow=4 != bcol=1 не подходит.

Как-то совсем негибко получается.

Помнится тут месяц-другой назад обсуждали кластеры в универах. Что они - эти кластеры - есть, а считать некому. Вспомнить бы ники, чтобы позвать этих обсуждающих сюда. Ну не может быть, чтобы никто ни разу не пробовал посчитать собственные векторы на кластере. Я уже молчу о том, что запустить orterun (или как раньше mpirun) -np 4 можно и на стареньком десктопе.

На parallel.ru тоже что-то не очень людно на форуме. Где же обитают те редкие кадры, работающие на кластерах?..

gag ★★★★★
(15.05.12 04:12:06 MSK) автор топика

Ответ на: комментарий от psv1967 14.05.12 13:39:21 MSK

Они там вот только 0.1.1 собрали. Тоже исключительно для i386. Кстати, вспомнил: один из тех людей - это ~~AIv~~.

gag ★★★★★
(16.05.12 13:54:08 MSK) автор топика

Ссылка

Ответ на: комментарий от gag 15.05.12 04:12:06 MSK

Где же обитают те редкие кадры, работающие на кластерах?..

Ну мы работаем.

~~AIv~~ ★★★★★
(16.05.12 14:12:58 MSK)

Ответ на: комментарий от AIv 16.05.12 14:12:58 MSK

Так ScaLAPACK используется на практике для распределённых решений задач линейной алгебры? Или использовалась бы, но нет потребности (тогда в чём потребность)?

gag ★★★★★
(16.05.12 15:04:55 MSK) автор топика

Ответ на: комментарий от gag 16.05.12 15:04:55 MSK

Нами не используется. Но мы и не решаем задачи линейной алгебры;-)

~~AIv~~ ★★★★★
(16.05.12 16:06:35 MSK)

Ответ на: комментарий от AIv 16.05.12 16:06:35 MSK

Ясно. А кто тут ещё пробегал с кластера?

gag ★★★★★
(16.05.12 16:08:57 MSK) автор топика

Ответ на: комментарий от gag 16.05.12 16:08:57 MSK

Reset должен быть в теме,Evgueni, marat2345.

~~AIv~~ ★★★★★
(16.05.12 16:17:29 MSK)

Ответ на: комментарий от AIv 16.05.12 16:17:29 MSK

Спасибо, тогда попросим заглянуть сюда Evgueni, marat2345. И вот только что нашёлся ещё один товарищ morse.

gag ★★★★★
(26.05.12 03:44:31 MSK) автор топика

Ответ на: комментарий от gag 26.05.12 03:44:31 MSK

Не, я от линейной алгебры бесконечно далек. Хотя диплом свой писал именно по лапаку. Я там сравнивал intel MKL, sun perflib, gotoblas, и amd'шную либу название которой уже не помню. Сравнивал на домашнем интелловском четырехядернике, не на кластере. Результат был такой: MKL всех уделал, gotoblas работал круто и параллельно только на некоторых функциях, а на некоторых - сливал по-черному, все остальные сливали MKL в два-четыре раза, даже в однопоточном режиме.

morse ★★★★★
(29.05.12 17:27:39 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	PCI - выделение DMA памяти

Development

Утечка памяти?

→

Похожие темы