Итеративно вычислить все 1/x при x = 1...n

алгебра, вычисления, матан, оптимизация, программирование

1

1

Изначально есть N/x, где N не меняется, а x = 1...n. Это можно свести к 1/x, поэтому далее будет идти речь о нём. Если есть более удачные варианты о них так же можно(и нужно) написать.

Гугл говорит, что основной методикой является это (wikipedia.org). Оно приспособлено для вычисления произвольного D, где в качестве нулевой итерации используется приближённое значение 1/D. Подобные методы так же предполагают аналогичное.

Я же предполагаю, что можно как-то использовать при вычислении 1/D предыдущие значения(1/(D - 1), 1/(D - 2), …), что должно дать куда более удачный метод, либо как минимум увеличить точно итераций.

Вопрос: Можно ли пользуясь тем, что нужно вычислить результат сразу для всех возможных D, упросить вычисление одного отдельного D.

P.S. чётные D можно не вычислять. Деление лучше вообще не использовать, либо использовать по минимуму.

Уточнение задачи: 1/x, где x целое, 3,5,7...n в диапазон не включены чётные числа.

Ссылка

←	Как парсить google maps панорамы?

Какие принципы использовать для реализации GUI на андроиде?

→

← 1 2 →

Имхо правильно мыслишь, должно получится несто вроде
(((((((((((((1+X(0))+X(1))+X(2) и так далее с переходом в цепочку вида

X(k+1)=(X(k-1)+1)X(k)

Если не путаю.

У тебя должно быть подобное.

torvn77 ★★★★★
(27.12.20 19:28:40 MSK)

Деление лучше вообще не использовать, либо использовать по минимуму.

Аппаратное ограничение?

~~Crocodoom~~ ★★★★★
(27.12.20 19:29:33 MSK)

Надо сумму всех N/x где x = 1...n? Это N / n!, зачем его вычислять? В каком виде это нужно в итоге?

где в качестве нулевой итерации используется приближённое значение 1/D

Точность значения 1/D тебя очень разочарует. Лучше его так и оставить.

crutch_master ★★★★★
(27.12.20 19:30:16 MSK)

Ответ на: комментарий от Crocodoom 27.12.20 19:29:33 MSK

Да, у процессоров очень плохо с делением.

~~sutrasarki~~
(27.12.20 19:39:31 MSK) автор топика

Ссылка

Ответ на: комментарий от crutch_master 27.12.20 19:30:16 MSK

Надо сумму всех N/x где x = 1…n?

Нет, не сумму. Нужны значения. Далее они используются в вычислениях.

~~sutrasarki~~
(27.12.20 19:41:48 MSK) автор топика

Ссылка

Если ты имплементируешь деление по Ньютону-Рафсону (NR), но сэкономить можно на том, что 1/(x-1) является хорошим приближением к 1/x, и ввиду квадратичной сходимости NR итераций (удвоение числа правильных цифр на каждой итерации), точное значение даже для double будет достигаться за 3-4 итерации на каждый x. Т.е. в твоём случае простейшей оптимизацией будет изначальное вычисление 1/1 (что тривиально), а затем вычисление 1/2 используя 1 как начальное приближение, потом 1/3 используя 1/2 как приближение и т.д. Можно даже сразу начать с 1/2 (захардкодить 1 и 1/2), и двигаться дальше, или, например, вычислять обратные к числам вида 2^n аналитически (обратные тривиально записать в бинарном виде), а промежуточные – по NR.

unanimous ★★★★★
(27.12.20 19:45:34 MSK)

Ответ на: комментарий от unanimous 27.12.20 19:45:34 MSK

Да, спасибо. До этого я уже додумался. Но всё равно итераций получается многовато, да и сами они достаточно тяжелые.

~~sutrasarki~~
(27.12.20 19:53:14 MSK) автор топика

в случае с непростыми числами можно заменить деление на умножение. для чётных будет сделать просто, но памяти понадобится как под lut для всех 1/x.

1/6 = 1/2 * 1/3

anonymous
(27.12.20 19:53:24 MSK)

Деление лучше вообще не использовать

А как ты будешь вычислять результат деления без деления?

ZERG ★★★★★
(27.12.20 20:00:56 MSK)

Ответ на: комментарий от sutrasarki 27.12.20 19:53:14 MSK

А какой длины у тебя ряд? Есть, если не ошибаюсь, асимптотическое разложение \sum_{k=1}^N 1/k \approx ln(N) - C0 + C1/N…

где C1 постоянная Каталана, а далее какие-то стремящиеся к 0 члены.

unanimous ★★★★★
(27.12.20 20:03:58 MSK)

Ответ на: комментарий от ZERG 27.12.20 20:00:56 MSK

Можно одно деление заменить двумя умножениями и одним lut.

~~lizik~~
(27.12.20 20:04:58 MSK)

Ответ на: комментарий от ZERG 27.12.20 20:00:56 MSK

Не тупи. Весь топик о том, как вычислить, например, floating-point представление 1/D используя только операции сложения/вычитания и умножения.

unanimous ★★★★★
(27.12.20 20:05:13 MSK)

Ответ на: комментарий от lizik 27.12.20 20:04:58 MSK

Ну кто-то же должен это заранее приготовить, таблицы Брадиса в студию!

ZERG ★★★★★
(27.12.20 20:13:26 MSK)

Ссылка

Ответ на: комментарий от crutch_master 27.12.20 19:30:16 MSK

Надо сумму всех N/x где x = 1...n? Это N / n!, зачем его вычислять?

Фейспалм. Если ты НАСТОЛЬКО не владеешь математикой, зачем ты в эту тему вообще зашёл?

Miguel ★★★★★
(27.12.20 20:15:58 MSK)

Ответ на: комментарий от unanimous 27.12.20 20:03:58 MSK

4 итерации для float

~~sutrasarki~~
(27.12.20 20:15:58 MSK) автор топика

Ссылка

Ответ на: комментарий от unanimous 27.12.20 20:05:13 MSK

Весь топик весьма сумбурный, именно поэтому я задал вопрос. ТС что-то хочет сделать, но непонятно, что именно, для чего, а уж самый важный вопрос заключается в том, нужно ли ему это. Может задача вообще без этого решается.

ZERG ★★★★★
(27.12.20 20:17:04 MSK)

Ответ на: комментарий от ZERG 27.12.20 20:17:04 MSK

От N/x не уйти. Подобное условие железно закреплено в алгоритме. Я его изменять не могу.

Что хочу? Посчитать не(практически) используя деление. Пользуясь особыми условиями упростить базовые алгоритмы. Мне кажется, что оно есть. Но чётко я её не вижу. Очень-очень смутно. Вот прошу помощи знатоков.

~~sutrasarki~~
(27.12.20 20:26:17 MSK) автор топика

Ответ на: комментарий от torvn77 27.12.20 19:28:40 MSK

Можешь раскрыть идею поподробнее?

~~sutrasarki~~
(27.12.20 20:27:38 MSK) автор топика

Ответ на: комментарий от sutrasarki 27.12.20 20:27:38 MSK

Ну выписываешь свой ряд sum(1/X(n)) и целяя Х уносишь его за скобки, а потом эту кучу скобок делишь на этапы, предыдущие скобки операнд для текущих и так далее.

torvn77 ★★★★★
(27.12.20 20:36:06 MSK)

Ссылка

Ответ на: комментарий от anonymous 27.12.20 19:53:24 MSK

1/6 = 1/2 * 1/3

на моей тачке ускорение получилось только в 1.6 раза, при занимаемой памяти n*sizeof(double). канпелял с -O2 -flax-vector-conversions -ffast-math -fassociative-math -march=native.

кот (pastebin.com).

anonymous
(27.12.20 20:37:35 MSK)

Ссылка

найти делитель для каждого числа, используя что-нибудь типа решета Эратосфена, и считать N/x как произведение соответствующих уже вычисленных дробей

Lrrr ★★★★★
(27.12.20 20:50:39 MSK)

Ссылка

Ответ на: комментарий от sutrasarki 27.12.20 20:26:17 MSK

Ну тогда lizik указал неплохое направление кмк, вот тебе быстрый гуглёж: https://stackoverflow.com/questions/12227126/division-as-multiply-and-lut-fast-float-division-reciprocal

ZERG ★★★★★
(27.12.20 21:01:10 MSK)

Ответ на: комментарий от sutrasarki 27.12.20 20:26:17 MSK

Не стоит забывать, что некоторые буквально школьные задачи тоже играют на руку: замени деление вычитанием и будь таков. Это классический пример, когда нужно преобразовать ряд, а у тебя члены типа 1/2*3, что есть 1/2 - 1/3.

ZERG ★★★★★
(27.12.20 21:05:43 MSK)

Ответ на: комментарий от ZERG 27.12.20 21:01:10 MSK

Направление там не очень успешное. Таблица не векторизуется. Для gpu/железяки вполне подойдёт, но это не универсальное решение.

Гуглёж - это то, о чём уже сказано в заглавии. Там те же самые ~4 итерации, только первая итерация заменена битхаком.

Я +/- знаю о многих подобных решениях. Вопрос заключается не в этом. Вопрос заключается в том - можно ли улучшить алгоритм вычисления пользуясь тем, что мне нужно вычислить не произвольное f(x), а диапазон f(1), f(3), ..., f(n).

~~sutrasarki~~
(27.12.20 21:24:56 MSK) автор топика

Ссылка

Ответ на: комментарий от ZERG 27.12.20 21:05:43 MSK

Я не бог весть какой решальщик школьных задачек, но пытался. Не получилось.

~~sutrasarki~~
(27.12.20 21:27:13 MSK) автор топика

Ответ на: комментарий от sutrasarki 27.12.20 21:27:13 MSK

Ну смотри, по определению 1/n*(n+1)=1/n-1/(n+1), в качестве примера возьми 1/6=1/(2 * 3)=1/2-1/3. Это самый базовый случай, который как раз тебе и подходит. Заранее не нужно вычислять все значения, а только часть из них. Не супер много, но что есть. К этому можно добавить 1/(n * n) и прочие степени, следуя завету Lrrr

ZERG ★★★★★
(27.12.20 21:45:22 MSK)
Последнее исправление: ZERG 27.12.20 21:46:10 MSK (всего исправлений: 1)

Ответ на: комментарий от ZERG 27.12.20 21:45:22 MSK

Проблема в том, что об этом даже не нужно думать. Любое наличие таблицы - тупиковый путь. Я понимаю о чём ты говоришь, о чём говорил он.

Вот у тебя есть 32байт simd. Это 8 float. Чтобы таблица имела хоть какой-то смысл - она должна быть в 8 раз быстрее. Попросту потому, что ты считаешь сразу 8 значение, а таблицей только одно. Это практически невозможно.

Поэтому, можешь сразу исключать табличные методы, если только таблицы специально не заточены под векторизацию. Это не везде применимо и эти мало кто занимается. Шансы найти что-то стремятся к нулю, а придумать ещё меньше.

~~sutrasarki~~
(27.12.20 22:10:50 MSK) автор топика

Составь таблицу 1/N для простых N и захардкодь. Остальные разлагай на множители и перемножай.

~~Legioner~~ ★★★★★
(27.12.20 22:41:44 MSK)

Ссылка

Ответ на: комментарий от sutrasarki 27.12.20 22:10:50 MSK

Поэтому, можешь сразу исключать табличные методы

Так ты определись наконец! То тебе «без делений», дали «без делений», нет мне теперь «без таблиц». Что на очереди?

anonymous
(28.12.20 03:26:18 MSK)

Ответ на: комментарий от anonymous 28.12.20 03:26:18 MSK

Таблица не является оптимальной на программном уровне. Практически везде. В требованиях было указано и то, что это оптимизация и то, что это программный уровень.

~~sutrasarki~~
(28.12.20 03:51:39 MSK) автор топика

Ссылка

Ответ на: комментарий от Miguel 27.12.20 20:15:58 MSK

Фейспалм

Да, я затупил.

crutch_master ★★★★★
(28.12.20 03:53:47 MSK)

Ссылка

ТС, у меня сразу к тебе ряд вопросов возник, основной: а какая точность тебе нужна? Потому как сходимость у алгоритмов разная, соответственно более сложные методы могут начать обгонять более быстрые при некоторой минимально необходимой точности.

Второй вопрос — а какие операции у тебя быстрые и доступные?

peregrine ★★★★★
(28.12.20 05:42:59 MSK)

Ответ на: комментарий от sutrasarki 27.12.20 22:10:50 MSK

Любое наличие таблицы - спасение, если она есть, всю работу сделали до тебя. Делай elementwise operations, будет тебе счастье, код сам векторизуется.

ZERG ★★★★★
(28.12.20 09:00:34 MSK)

Ответ на: комментарий от peregrine 28.12.20 05:42:59 MSK

Сейчас это не принципиально. В данной задаче минимально бит 15-20, возможно весь флоат. Меня же интересуют, в том числе, и более общие решения. С произвольной точностью. Возможно в будущем пригодятся.

Второй вопрос — а какие операции у тебя быстрые и доступные?

Да практически любые. Все базовые, кроме деления. Битовые операции. Основной(и единственный, скорее всего) таргет - это современный процессор с simd.

~~sutrasarki~~
(28.12.20 19:49:24 MSK) автор топика

Ссылка

Ответ на: комментарий от ZERG 28.12.20 09:00:34 MSK

Любое наличие таблицы - спасение

Нет. Причины я назвал выше.

Делай elementwise operations, будет тебе счастье, код сам векторизуется.

Это так не работает. Ничего не может векторизоваться, когда осуществляется лукап для каждого отдельного элемента в векторе.

~~sutrasarki~~
(28.12.20 19:55:18 MSK) автор топика

Ответ на: комментарий от sutrasarki 28.12.20 19:55:18 MSK

Точно, это же lut, я почему-то про обычный вектор со значениями думал. А что тебе мешает векторизовать первый метод по ссылке выше?

ZERG ★★★★★
(29.12.20 11:08:18 MSK)

Ответ на: комментарий от ZERG 27.12.20 20:00:56 MSK

Умножать на значения из таблицы?

LongLiveUbuntu ★★★★★
(29.12.20 15:28:00 MSK)

Ответ на: комментарий от sutrasarki 28.12.20 19:55:18 MSK

считаешь сразу 8 значение, а таблицей только одно

Ничего не может векторизоваться, когда осуществляется лукап

можно загружать из таблицы сразу по 8 значений одной инструкцией.

anonymous
(29.12.20 21:25:10 MSK)

Ответ на: комментарий от LongLiveUbuntu 29.12.20 15:28:00 MSK

Ну таблицы же тоже не архангел на скрижалях принёс.

ZERG ★★★★★
(29.12.20 21:58:10 MSK)

Ответ на: комментарий от ZERG 29.12.20 11:08:18 MSK

Векторизовывать сам метод не имеет смысла, но речь не об этом. Меня интересует лишь то, что сказано в заглавии. Зачем мне давать ссылку на метод, который я сам же привёл в качестве примера, про который знаю?

Задача заключается в том, чтобы пользуясь описанными обстоятельствами найти лучшее решение. Решение лучшее, нежели вычисление каждой операции по отдельности.

~~sutrasarki~~
(30.12.20 03:41:46 MSK) автор топика

Ссылка

Ответ на: комментарий от anonymous 29.12.20 21:25:10 MSK

Ну и делить можно одной инструкцией. Нет смысла считать инструкции - это работает не так. Подобные инструкции существуют лишь для обхода ограничений фронтента/разгрузки его. Глобально они ничего меняют и чуда не производят.

~~sutrasarki~~
(30.12.20 03:47:21 MSK) автор топика

Ссылка

Ответ на: комментарий от ZERG 29.12.20 21:58:10 MSK

Ищется эффективный метод. Метод же неэффективный искать ненужно. Он очевиден и всегда присутствует. Да и значения можно предрассчитать.

~~sutrasarki~~
(30.12.20 03:48:27 MSK) автор топика

Ответ на: комментарий от sutrasarki 30.12.20 03:48:27 MSK

Тупой вопрос. А ты пробовал реализовать предложенные в треде варианты и замерить скорость вычислений?

~~a1batross~~ ★★★★★
(30.12.20 09:43:55 MSK)

Ответ на: комментарий от a1batross 30.12.20 09:43:55 MSK

Тупой ответ. Предложения с таблицей сольют. Более ничего не предлагалось. К тому же что и зачем там реализовывать? Не все слепые, чтобы тыкаться в каждый угол. И ненужно биться головою о стену, чтобы оценить результат этого действия.

~~sutrasarki~~
(30.12.20 11:19:52 MSK) автор топика

Можно ли модифицировать клиентский алгоритм, чтобы он затребовал не значения по порядку возрастания n, а например сначала значения, кратные простым числам? 1/3, 1/6, … , 1/24, 1/5, 1/10, … ,1/40

anymouse ★
(30.12.20 20:35:35 MSK)

Ответ на: комментарий от anymouse 30.12.20 20:35:35 MSK

Скорее всего можно. Там рантайм-условие при генерации. Если оно не будет слишком сильно заходить вперёд - можно.

А даже если нет - любые идеи приветствуются.

~~sutrasarki~~
(30.12.20 22:03:13 MSK) автор топика

Ссылка

Ответ на: комментарий от sutrasarki 30.12.20 11:19:52 MSK

Необязательно.

~~a1batross~~ ★★★★★
(31.12.20 01:30:15 MSK)

Ответ на: комментарий от a1batross 31.12.20 01:30:15 MSK

Обязательно. Выше причины оговаривались. Таблица не векторизуется, если это не специальная таблица. Это значит, что отношение вычисляемых значений в каждый момент времени - это 1:8. 256bit/float. И это минимальное соотношение. Таким образом, чтобы хотя бы догнать векторизацию - таблица должна быть минимум в 8 раз быстрее.

Даже если мы инплейс вычисляем индекс, а не читаем его из памяти и сам индекс берём из астрала за ноль, то. Производительность только этой одной операции 2/такт, т.е. 4 для 8.

Производительность же полного вычисления методом на который я ссылался изначально - это в лучшем случае 2 такта. rcp + итерация NR(fma + mul). В худшем - это 3-4 итерации. Одна итерация ~1 такт.

Поэтому, даже в случае помощи астрала при реализации фантастической таблицы x => lut[x] - она никак не может быть быстрее. Она будет как максимум примерно равной худшему случаю оппонента.

~~sutrasarki~~
(31.12.20 02:21:20 MSK) автор топика

Ответ на: комментарий от sutrasarki 31.12.20 02:21:20 MSK

Пока ты рассуждаешь в отрыве от минимально необходимой точности и объёма ожидаемых данных, разговор ни о чём.

ЗЫ

Если у тебя делитель всегда целое, то построй кусочную функцию, совпадающую с твоей дробно-линейной в твоих делителях и попробуй зайти с формулами с этого краю. Скорее всего ничего лучше ты не сможешь придумать, возможно что-то сможешь упростить, но я не уверен в этом. Можно даже со стороны геометрии глянуть на то что у тебя получится. Делать это за тебя я не буду, так как подозреваю что это либо ничего не даст, либо выльется в очень сложную задачу чистой математики.

peregrine ★★★★★
(31.12.20 02:44:36 MSK)
Последнее исправление: peregrine 31.12.20 02:47:23 MSK (всего исправлений: 2)

Ответ на: комментарий от peregrine 31.12.20 02:44:36 MSK

Пока ты рассуждаешь в отрыве от минимально необходимой точности

Не рассуждаю. Нужная же мне определена выше. Предложить решение ты можешь с любой точностью. Нет смысла ставить дополнительные условия, когда задача даже не начала решиться в более широких.

и объёма ожидаемых данных

Мне ненужны рассказы про объёмы данных. На саму задачу это никак не влияет.

~~sutrasarki~~
(31.12.20 03:35:10 MSK) автор топика

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← 1 2 →

←	Как парсить google maps панорамы?

Development

Какие принципы использовать для реализации GUI на андроиде?

→

Похожие темы