Перебор вариантов

0

2

Есть программа (сейчас на матлабе), в которой я перебираю большое количество вариантов, точнее, все последовательности 0 и 1 размером n, т.е. 2^n. Соответственно, начало следующее:

parfor i = 1:2^(box_size^2/2)-1

 c_points = de2bi(i,box_size^2/2);
 
 box = zeros(box_size+2,box_size+2);

 for j = 1:box_size
     box(j+1,2+rem(j,2):2:box_size+1) = c_points(1 + (j-1)*box_size/2:j*box_size/2);
 end

de2bi - преобразует неотрицательное целое число i в вектор-строку двоичных цифр.

Есть ли простые способы это оптимизировать? Например, есть ли способ генерировать эти 0-1 строки оптимальнее? Сейчас выполнение занимает слишком много времени. Далее происходят не слишком сложные операции с матрицей box и, скорее всего, я даже готов переписать это на каком-нибудь другом языке, если это принесет ощутимый прирост к скорости выполнения.

Ссылка

← Помогите с регулярным выражением (PHP)

При установке SSL будут ли работать виджеты через http? →

объясни, пожалуйста, что эти каракули обозначают.

большое количество вариантов
выполнение занимает слишком много времени

а с чем ты сравниваешь? может быть затрачиваемое время адекватно. лучше бы ты привёл цифры и конкретизировал задачу вместо этого куска говнокода.

anonymous
(12.06.17 15:17:23 MSK)

Ответ на: комментарий от anonymous 12.06.17 15:17:23 MSK

объясни, пожалуйста, что эти каракули обозначают.

Что, кроме того, что написано в ОП, тебе непонятно? parfor? Параллельный for.

а с чем ты сравниваешь?

Непозволительно много для меня времени. Я задал вопрос про оптимизацию.

лучше бы ты привёл цифры и конкретизировал задачу вместо этого куска говнокода.

Стандартный ответ человека, который не читает дальше первой строки. Из кода достаточно ясно, что я хочу сгенерировать все такие матрицы box со всеми возможными комбинациями 0-1 на нечётных местах. box_size=10, например.

Что я потом делаю с этой box значения не имеет.

tyakos ★★★
(12.06.17 15:43:46 MSK) автор топика

Ты же понимаешь, что ты перебираешь все последовательности.

ZERG ★★★★★
(12.06.17 16:02:26 MSK)

Ответ на: комментарий от ZERG 12.06.17 16:02:26 MSK

Да.

tyakos ★★★
(12.06.17 16:09:45 MSK) автор топика

Ответ на: комментарий от tyakos 12.06.17 16:09:45 MSK

Ну так у тебя принципиального ускорения не будет, это же чистая комбинаторика. Максимум, что я вижу сейчас, - переместить параллельный цикл вниз и считать строку частями: сохранять то, что есть, чтобы не считать дважды.

ZERG ★★★★★
(12.06.17 16:18:34 MSK)

Ответ на: комментарий от ZERG 12.06.17 16:18:34 MSK

Мне кажется, что должен быть способ лучше, чем дёргать de2bi. Мне же не обязательно, чтобы i обрабатывались поочередно.

Дальше у меня идут простые арифметические операции, их количество порядка box_size^2.

А вот для больших i у меня возникают сомнения в эффективности использования de2bi.

tyakos ★★★
(12.06.17 16:39:35 MSK) автор топика

Ссылка

Ответ на: комментарий от tyakos 12.06.17 15:43:46 MSK

box_size=10
2^(box_size^2/2)-1

1125899906842623

а, ну ок, успехов

anonymous
(12.06.17 17:01:39 MSK)

Ссылка

Ответ на: комментарий от ZERG 12.06.17 16:18:34 MSK

А, нет, de2bi отрабатывает быстро. На цикл уходит «Elapsed time is 0.000055 seconds», из которых 0.000014 - de2bi, что уже для box_size=10, даже в 4 потока, займет 500 лет.

В любом случае, спасибо за советы, буду придумывать другие методы.

tyakos ★★★
(12.06.17 17:15:07 MSK) автор топика

Ответ на: комментарий от tyakos 12.06.17 17:15:07 MSK

http://mathworld.wolfram.com/Self-AvoidingWalkConnectiveConstant.html

Надо почитать, как они «have enumerated walks of up to length 51», что простым перебором, как у меня, будет ~3^51 вариантов.

tyakos ★★★
(12.06.17 17:20:25 MSK) автор топика

Ответ на: комментарий от tyakos 12.06.17 17:15:07 MSK

500 лет

теоретически, если оптимизировать, то на современном 8-ядерном пк можно перебрать все варианты для box_size=10 меньше чем за двое суток (1.3 по моим подсчётам). но это только перебрать.

anonymous
(12.06.17 17:27:14 MSK)

Ответ на: комментарий от anonymous 12.06.17 17:27:14 MSK

Это-то отлично, но я хотел это потом расширить для 3х измерений, т.е. 10х10х10. Или хотя бы 8х8х8.

Но ты всё равно расскажи, как? Интересно же.

tyakos ★★★
(12.06.17 17:36:40 MSK) автор топика

Ответ на: комментарий от tyakos 12.06.17 17:36:40 MSK

с распараллеливанием и использованием инструкций avx, лучше писать на си или асме, чтобы было минимум оверхеда. я делал на асме простую программу, складывающую числа от 1 до миллиарда. на моём процессоре она выполнялась за 75 миллисекунд.

anonymous
(12.06.17 18:12:12 MSK)

Ответ на: комментарий от anonymous 12.06.17 17:27:14 MSK

Ты предыдущие итерации в памяти хранишь?

ZERG ★★★★★
(12.06.17 21:25:59 MSK)

Ссылка

Ответ на: комментарий от anonymous 12.06.17 18:12:12 MSK

Так ты привёл пример совсем простой задачи.

ZERG ★★★★★
(12.06.17 21:27:10 MSK)

Ссылка

Кста, https://habrahabr.ru/post/330690/

ZERG ★★★★★
(12.06.17 21:32:04 MSK)

Ссылка

Ответ на: комментарий от tyakos 12.06.17 17:20:25 MSK

Надо почитать, как они «have enumerated walks of up to length 51»

почитай кнута, «искусство программирования», том 4 «комбинаторные алгоримы»

dsxl ★
(12.06.17 21:48:33 MSK)

Я ничего из написанного тут не понимаю, но надо использовать мемоизацию

zolden ★★★★★
(12.06.17 21:52:38 MSK)

Ссылка

Ответ на: комментарий от dsxl 12.06.17 21:48:33 MSK

Я почитал их новую статью 2016 года. Скорее всего, кнут имеет к этому отношение весьма посредственное.

Но почитать стоит, да.

tyakos ★★★
(13.06.17 00:15:27 MSK) автор топика

Ссылка

Ответ на: комментарий от anonymous 12.06.17 18:12:12 MSK

написал на С, с флагом -О3 занимает порядка 20.

ZERG ★★★★★
(13.06.17 14:16:15 MSK)

Ответ на: комментарий от ZERG 13.06.17 14:16:15 MSK

скорее всего компилятор сокращает цикл до одной инструкции. код покажешь?

anonymous
(13.06.17 15:16:48 MSK)

Ответ на: комментарий от anonymous 13.06.17 15:16:48 MSK

Так тут и показывать-то нечего:

#include <stdio.h>
#include <stdint.h>
int main()
{
	unsigned long long int j, i = 0;
	for ( j = 1; j <= 1000000000; j++)
	{
		i +=j;
	}
	printf("sum = %llu \n", i);
}

Пока писал этот пост - нашёл ошибку. Странно, что -Wall не ругался на переполнение int. И, да, надо будет весь свой код теперь проверять, боюсь, что может быть такой же косяк.

Есть мысль, что всё после оптимизации сводится к трюку Гаусса: sum = n*(n+1)/2

ZERG ★★★★★
(13.06.17 17:19:45 MSK)

Ответ на: комментарий от ZERG 13.06.17 17:19:45 MSK

вот что на это генерирует компилятор с -O2:

main:
    sub	rsp, 8
    mov	edi, OFFSET FLAT:.LC0
    xor	eax, eax
    movabs	rsi, 500000000500000000
    call	printf
    xor	eax, eax
    add	rsp, 8
    ret

anonymous
(13.06.17 18:49:28 MSK)

Ответ на: комментарий от anonymous 13.06.17 18:49:28 MSK

Ну я не удивлён, Гаусс, храни его господь.

ZERG ★★★★★
(14.06.17 15:04:26 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Помогите с регулярным выражением (PHP)

Development

При установке SSL будут ли работать виджеты через http? →

Похожие темы