Пересечение множеств

0

0

Привет!

Предположим, что есть два множества.
A : |A| = n
B : |B| = m

Элементы данных множеств - целые положительные числа.
Задача заключается в нахождении пересечения данных множеств.

Очевидный подход - реализовать множества как списки, поддерживать 
их отсортированными и искать пересечение одним проходом по обоим
спискам.

Получаем алгоритм со сложностью O(n+m).

Можно ли найти пересечение быстрее?

Спасибо!

Ссылка

← Линкер, не удалять неиспользуемые классы

C-библиотека для структур →

> Можно ли найти пересечение быстрее?

Поддерживать список с пересечением? При изменении множеств делать актуализацию.

mv ★★★★★
(07.03.08 12:26:17 MSK)

Ссылка

Сортировка твоё O(n) убивает напрочь.

annoynymous ★★
(07.03.08 13:24:53 MSK)

сперва ты должен четко понять какой диапазон у чисел, какие операции и как часто будут проводиться с множествами.

dilmah ★★★★★
(07.03.08 13:44:56 MSK)

Ответ на: комментарий от dilmah 07.03.08 13:44:56 MSK

Эту задачу нельзя рассматривать в отрыве от того, как эти множества будут создаваться и использоваться. Решений может быть множество :) Сама же по себе задача в сформулированном виде имеет лишь академический интерес.

Хранение чисел отсортированными является хорошей идеей, но здесь не будет общих решений, пока задача не конкретизирована и не определены более четко use cases.

~~dave~~ ★★★★★
(07.03.08 17:25:15 MSK)

Ссылка

Видимо, dilmah имел ввиду использование битовых масок для представления множеств. Так реализованы множества в Pascal/Ada/Modula etc. Это было бы действительно самым быстрым способом, но там есть жесткое ограничение на диапазон чисел (точнее на мощность их диапазона).

~~dave~~ ★★★★★
(07.03.08 17:38:15 MSK)

Ссылка

Если вариант с битовыми масками не подойдёт, лучше использовать дерево, храня в каждом узле, помимо значения, 2 бита. 0-й устанавливать, если число пришло из первого множества, 1-й устанавливать, если число пришло из второго множества. Тогда пересечение, в отсортированном виде, находится обходом в глубину.

А вариант со списками, это O(n^2) + O(m^2) в худшем случае.

~~Legioner~~ ★★★★★
(07.03.08 20:21:28 MSK)

Согласен с предыдущими ораторами -- телепаты нынче в отпуске :-)

Решений масса -- битовые маски, деревья (двоичные, B, префиксные), хэши; их комбинации...

Die-Hard ★★★★★
(09.03.08 02:03:13 MSK)

Ссылка

Для произвольных множеств - думаю невозможно быстрее чем за m+n. Собственно, для этого тебе надо знать об элементах множеств что-то такое, что даст возможность смотреть не на все элементы. Ибо просто пройтись по ним - m+n

ratatosk ★
(09.03.08 07:12:03 MSK)

Ссылка

Сделать хеш размером max(m,n). Если возникает коллизия, значит что-то уже есть в этом хеше. Значит, возникло пересечение. Итого, вместо O(m+n) получается O(max(m,n))

anonymous
(09.03.08 14:13:28 MSK)

Ответ на: комментарий от anonymous 09.03.08 14:13:28 MSK

> вместо O(m+n) получается O(max(m,n))

анекдоты в big O notation

grob ★★★★★
(10.03.08 07:30:56 MSK)

Ссылка

A = set((1, 2, 3))
B = set((0, 2, 4, 5))
print A.intersection(B)

rei3er ★
(10.03.08 10:28:13 MSK)

Ссылка

Ответ на: комментарий от annoynymous 07.03.08 13:24:53 MSK

>> Сортировка твоё O(n) убивает напрочь.

Учи матчасть. Все задачи доступа к множеству в виде упорядоченного списка имеют сложность O(n). Твое предложение ничем не лучше чем хранить множество в виде неупорядоченного списка, на пересечении получишь O(n^2) минимум, плюс сложность сортировки.

cathode ★
(14.03.08 12:25:55 MSK)

Ссылка

Ответ на: комментарий от anonymous 09.03.08 14:13:28 MSK

>> Сделать хеш размером max(m,n). Если возникает коллизия, значит что-то уже есть в этом хеше. Значит, возникло пересечение. Итого, вместо O(m+n) получается O(max(m,n))

В упорядоченном списке сложность и так O(max(m,n)), что равно O(m+n) кстати. А вот хештаблица может дать тебе O(1) (опять же смотря как хранить хеши).

cathode ★
(14.03.08 12:29:32 MSK)

Ссылка

Ответ на: комментарий от Legioner 07.03.08 20:21:28 MSK

>> Если вариант с битовыми масками не подойдёт, лучше использовать дерево, храня в каждом узле, помимо значения, 2 бита. 0-й устанавливать, если число пришло из первого множества, 1-й устанавливать, если число пришло из второго множества. Тогда пересечение, в отсортированном виде, находится обходом в глубину.

И что? Сложность O(n), т.к. надо просмотреть все дерево. Та же самая сложность получается при пересечении двух бинарных деревьев (не обязательно даже сбалансированных).

cathode ★
(14.03.08 12:49:25 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Линкер, не удалять неиспользуемые классы

Development

C-библиотека для структур →

Похожие темы