Структура данных

0

3

Есть множество кубов заданных координатами центров и длиной ребра. Их много и они могут наслаиваться, но зато все координаты и размеры целые. Нужен алгоритм, который по координатам точки (тоже целым) выдаст список всех кубов, в которые она попадает (допустим, у кубов есть идентификаторы или хотя бы номера). При этом нужна также возможность быстро двигать кубы (менять координаты центров, однако, обычно за один шаг сдвиг мал). Запросы на принадлежность точек происходят чаще, чем сдвиги кубов.

Например, у нас есть 1000 кубов, они двигаются раз в секунду (в разное время), а каждую секунду мы проверяем миллион точек.

Какая структура данных лучше всего для этого подходит?

Ссылка

← Разработка под cc2530

Предекларация функции в анонимном пространстве имён C++ →

А как же углы вращения? Или они все вдоль осей?

firkax ★★★★★
(14.11.22 17:54:53 MSK)

Можно начать с более простой задачи - проиндексировать аналогичным образом список одномерных интервалов.

firkax ★★★★★
(14.11.22 17:55:46 MSK)

Ответ на: комментарий от firkax 14.11.22 17:54:53 MSK

Все вдоль осей

KivApple ★★★★★
(14.11.22 18:09:00 MSK) автор топика

Ссылка

Во первых как ты проверяешь принадлежность кубу? Через x > x0 && x < x1 & ... или через манхеттенское расстояние до центра? Второе будет быстрее.

Не знаю есть ли какой-то готовый алгоритм под это, но вот что можно попробовать.

разбить пространство на области, при каждом сдвиге куба размещать указатель на наего в те области, которые он пересекает. Тогда при проверке точки ты будешь смотреть уже не все кубы, а только закешированный участок. Но это не будет работать, если все кубы будут в одной области.
сделать sqlite базу в оперативке и закинуть туда данные кубов. Звучит как адовый оверхед, но если кубов прям много, то алгоритмы индексирования при правильных запросах могут дать увеличение скорости над проходом в ручную

Aswed ★★★★★
(14.11.22 18:42:00 MSK)

Ссылка

какой характерный объем куба?
сколько кубов?
какая доля пространства не относится ни к одному кубу?
размерность пространства тройка?

~~AntonI~~ ★★★★★
(14.11.22 18:46:54 MSK)
Последнее исправление: AntonI 14.11.22 18:47:50 MSK (всего исправлений: 1)

Да вроде ничего нового - octree, rtree, а учитывая дискретность пространства ещё и обычный хэш по клеточкам. Выбор зависит от заполненности пространства, размера кубов, количества перекрытий, диапазонов координат.

slovazap ★★★★★
(14.11.22 18:50:13 MSK)

Ответ на: комментарий от AntonI 14.11.22 18:46:54 MSK

Размерность пространства тройка. Характерная длина ребра куба не больше 20-30. Но сами значения координат ограничены лишь int. Кубов в районе тысячи. Проверки точек гораздо чаще модификации кубов.

KivApple ★★★★★
(14.11.22 18:51:15 MSK) автор топика

Ответ на: комментарий от slovazap 14.11.22 18:50:13 MSK

Вариантов дофига, напр. сетка Верле. Вводим равномерную сетку с шагом больше единицы (сколько именно - надо оценивать), в каждой ячейке лежит список цепляющих ее кубов. Шаг сетки такой что бы сетка хорошо лезла в память, а лучше в хэш. Дальше сразу находим ячейку сетки, а в ячейке уже прямой перебор.

Нужно больше информации о задаче.

~~AntonI~~ ★★★★★
(14.11.22 18:53:37 MSK)

Ссылка

Ответ на: комментарий от KivApple 14.11.22 18:51:15 MSK

Характерная длина ребра куба не больше 20-30. Но сами значения координат ограничены лишь int.

А насколько кучно расположены кубы и насколько они пересекаются? Можно какой то небольшой вмещающий куб построить, или несколько?

~~AntonI~~ ★★★★★
(14.11.22 18:56:26 MSK)

Ссылка

Ответ на: комментарий от firkax 14.11.22 17:55:46 MSK

В одномерном случае гораздо проще жить, там естественное упорядочение есть.

~~AntonI~~ ★★★★★
(14.11.22 19:00:16 MSK)

Предлагаю посмотреть https://en.wikipedia.org/wiki/R-tree

imatveev13 ★★
(14.11.22 19:05:14 MSK)

Ссылка

Ответ на: комментарий от AntonI 14.11.22 19:00:16 MSK

В том и дело, там проще, но сложности уже вылезают. Если сначала решить их, то 3-мерное будет не так неподъёмно смотреться.

firkax ★★★★★
(14.11.22 19:47:48 MSK)
Последнее исправление: firkax 14.11.22 19:48:33 MSK (всего исправлений: 1)

Если кубов 1000 то просто массив с центрами и размерами, быстрее всё посчитать чем городить, что-то.

Если их миллион и нужны только те что наблюдаются (есть камера?) то массив с отсечением того что не видно через фруструм.

Если их миллион и важны не те что видны, а все наверное типа такого https://habr.com/ru/post/473066/ только в 3D

Ты выбираешь точку для проверки, определяются те кубы что входят в «клетку» и проверяются только они.

А так, просто массив или несколько массивов, например назбить весь мир на 8 больших кубов. То есть 8 массивов (или один разбитый на 8 частей) с данными кубиков. Ты выбираешь точку определяешь в каком из кубов мира она и проверяешь только те кубики которые живут в этом кубе, при трансформации кубиков и их перемещении проверяешь не переселился ли кубик в другой мировой куб ну и просто данные копируешь из одного элемента массива в другой.

Короче что угодно что позволит отсекать то что в принципе не нужно считать.

LINUX-ORG-RU ★★★★★
(14.11.22 20:42:36 MSK)
Последнее исправление: LINUX-ORG-RU 14.11.22 20:43:53 MSK (всего исправлений: 1)

Ссылка

Похоже на R-дерево, оптимизированное под конкретную задачу.

soomrack ★★★★★
(14.11.22 22:40:37 MSK)

Ссылка

Похоже на модифицированную задачу с обнаружением столкновений. Погуглите по ключевым «collision detection».

Из подходов могу предложить разбить трёхмерное пространство на некоторое количество частей так, чтобы в каждой части было не больше n кубов. И уже в этих получившихся кусках пространства отсматривать на коллизии.

czan ★
(15.11.22 00:21:21 MSK)

Ссылка

Ответ на: комментарий от firkax 14.11.22 19:47:48 MSK

Сложностей там не так много, нужны упорядоченные массивы/мапы отдельно для левых и правых границ интервалов и затем поиск пересечения двух множеств.

Уже в 2D такое не прокатит.

~~AntonI~~ ★★★★★
(15.11.22 07:20:52 MSK)
Последнее исправление: AntonI 15.11.22 07:21:32 MSK (всего исправлений: 2)

Ответ на: комментарий от AntonI 15.11.22 07:20:52 MSK

Этот самый «поиск пересечения» и есть главная проблема.

А для 2д тоже нужно пересечение, но не двух а четырёх множеств.

firkax ★★★★★
(15.11.22 11:04:06 MSK)

Ответ на: комментарий от firkax 15.11.22 11:04:06 MSK

Для 1000 элементов поиск пересечения двух множеств это 20 операций с 64х битными числами. Для 3D 8 множеств, это уже на порядок сложнее. Но в целом - это может быть для ТС рабочим вариантом - просто, делается на коленке и наверное будет все же быстрее (по крайней мере в разы) чем прямой перебор.

Правда ТС не сказал насчет параллельности алгоритма поиска, это отдельная история.

~~AntonI~~ ★★★★★
(15.11.22 13:26:28 MSK)
Последнее исправление: AntonI 15.11.22 13:27:09 MSK (всего исправлений: 1)

Ответ на: комментарий от AntonI 15.11.22 13:26:28 MSK

Как раз в такой формулировке разницы вообще нет - оно получается O(N) и там и там, то есть то же самое что полный перебор, только коэфициент поменьше. Только вот в моём понимании индексирование подразумевает что вместо O(N) должно получаться хотя бы O(sqrt(N)). Ну, если знать что кубов не больше 1000 то может и вариант.

firkax ★★★★★
(15.11.22 14:21:31 MSK)
Последнее исправление: firkax 15.11.22 14:22:17 MSK (всего исправлений: 1)

Ответ на: комментарий от firkax 15.11.22 14:21:31 MSK

Вот тут как бэ то место, где теория алгоритмов вдребезги разбивается о суровую действительность;-)

С т.з. практики все эти O(…) неважны, а важны времена работы. И O(N^2) с маленьким коэффициентом будет до некоторого N лучше чем O(N) с большим коэффициентом.

Я уж не говорю про конвейр, векторизацию, вред ветвлений, обращения к менеджеру памяти и тд и тп.

Так то, для 1000 кубов, все это больше смахивает на преждевременную оптимизацию. Сначала надо сделать прямой перебор, профилирование, а потом уже, если выясниться что это узкое место, думать над изощренными структурами данных.

~~AntonI~~ ★★★★★
(15.11.22 14:29:09 MSK)
Последнее исправление: AntonI 15.11.22 14:30:13 MSK (всего исправлений: 1)

Ссылка

R-tree

trisobakov
(16.11.22 07:24:09 MSK)

Ссылка

Запросы на принадлежность точек происходят чаще, чем сдвиги кубов.
Какая структура данных лучше всего для этого подходит?

три координатных вектора, и один мутекс. любой запрос на движение куба в нитку. куб shared_ptr. всё.

самое главное забыл - пишу софт за деньги)

anonymous2 ★★★★★
(20.11.22 15:29:58 MSK)
Последнее исправление: anonymous2 20.11.22 15:42:41 MSK (всего исправлений: 4)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Разработка под cc2530

Development

Предекларация функции в анонимном пространстве имён C++ →

Похожие темы