Оптимальная структура данных

1

1

Имеется таблица из трех колонок. Первая — просто номер строки. Во второй и третьей — целые числа. Пример:

1 3 2

2 4 3

3 4 2

4 5 3

5 6 3

и т.д. Пары чисел, образованные второй и третьей колонками, не повторяются. Но по отдельности могут повторяться, как в примере. Нужно по номеру строки получать числа из колонок и наоборот: по заданной паре найти номер строки. Какая структура данных лучше всего для этого подходит? Наивным вариантом был бы массив пар, тогда a[i].up, a[i].low давали бы числа во второй и третьей колонках из строки i. Но в этом случае неудобно искать в обратную сторону, то есть по паре получать индекс.

Ссылка

←	Ошибка при линковке исполняемого файла

Не могу осилить Gettext

→

Заведи два контейнера, для поиска в одну сторону и в другую.

Gvidon ★★★★
(26.06.17 12:30:26 MSK)

Ссылка

какие либо ещё ограничения на данных есть?

например в приведённом примере колонка up у тебя упорядоченны по не убыванию

если это действительно то обратное - по паре номер можно бинарём по up-колонке

--- если заранее известен диапазон одной из колонок то можно сделать синтетический ключ - пусть A-диапазон колонки, а а и б значения тогда можно хранить какое либо уподядочение по синтетическому ключу б*A+а и значении номер строки - и каким либо способом(зависящий от метода хранения таких пар(синтетика,номер_строки))- быстро(не менление логарифма опятьже ну и переходе на линейный поиск на дюжине вроде)

anonymous
(26.06.17 12:42:25 MSK)

Ссылка

tree ?

anonymous
(26.06.17 12:49:45 MSK)

Ссылка

Классическая структура связи «многие-ко-многим» © — пример таблицы о пиве.

quickquest ★★★★★
(26.06.17 13:49:52 MSK)

Ссылка

я бы использовал 2 hash tables (в некоторых ЯП - ассоциативные массивы, словари и тд).

key: номер строки, value: пара чисел
соотвественно наоборот:)

uglym8
(26.06.17 14:07:24 MSK)

Ссылка

остортированyый по парам массив (если тебя поиск в основном интересует)

получение по индексу = O(1)

получение индекса по паре - O(log(n))

НО вставка O(n)

anonymous
(26.06.17 14:11:36 MSK)

Ссылка

а это смотря как вы используете (планируете использовать) сию таблицу. От этого и зависит которое измерение первое.

при работе с СУБД как правило удобнее ориентироваться на строки - там данные прилетают и требуются как правило строками/наборами;

при работе с экспериментальными и расчётными данными - на столбцы - там обычно отдаёшь/получаешь готовые массивы/срезы по столбцам.

А лучше сделать вдоль - написать интерфейс под который подстроить и тот и другой способ организации конечных данных и не заботится про пустяки до первого stable.

MKuznetsov ★★★★★
(27.06.17 00:11:54 MSK)

Ссылка

Как в базах данных: массив пар и обратный индекс к нему.

urxvt ★★★★★
(27.06.17 01:00:45 MSK)

Ссылка

Нужно по номеру строки получать числа из колонок

Делаешь массив

uint8_t arr[][2] ={{3,2}, {4,3}, {4,2}, {5,3}, {6,3}};

Первая колонка — вообще незачем ее хранить.

наоборот: по заданной паре найти номер строки.

Надо сцепить пары таким образом, чтобы одно целое число было. Например, в случае uint8_t у нас каждое число занимает 1 байт. Пара соотвественно 2 байт. Ну, очевидно

size_t map[] = {
  [(3<<8) | 2] = 0,  [(4<<8) | 3] = 1, 
  [(4<<8) | 2] = 2,  [(5<<8) | 3] = 3,
  [(6<<8) | 3] = 4
}

см. https://gcc.gnu.org/onlinedocs/gcc-6.3.0/gcc/Designated-Inits.html

И таким образом, если сделать обращение к массиву map[(4<<8) | 2] то там будет индекс массива для arr[][2]

Только первая колонка отсуствует, и там вся индексация будет начинаться с 0 а не с 1, но это думаю не особо критично

SZT ★★★★★
(27.06.17 08:59:34 MSK)
Последнее исправление: SZT 27.06.17 09:01:32 MSK (всего исправлений: 2)

Ответ на: комментарий от SZT 27.06.17 08:59:34 MSK

Или даже как-нибудь так

size_t map[256][256] = {
  [3][2] = 0,  [4][3] = 1, 
  [4][2] = 2,  [5][3] = 3,
  [6][3] = 4
};

Но вообще возникает резонный вопрос: а пары могут повторятся в том смысле, что одна пара это например 2, 3 а другая 3, 2, или это будем считать одной и той же парой?

SZT ★★★★★
(27.06.17 09:08:02 MSK)

Ответ на: комментарий от SZT 27.06.17 09:08:02 MSK

Но вообще возникает резонный вопрос: а пары могут повторятся в том смысле, что одна пара это например 2, 3 а другая 3, 2, или это будем считать одной и той же парой?

Можно считать, что первое число в паре всегда больше второго, как в примере.

~~hotpil~~ ★★★★
(27.06.17 09:24:30 MSK) автор топика

Ответ на: комментарий от hotpil 27.06.17 09:24:30 MSK

В таком случае можно кое-что заоптимизировать, ключевые слова triangular matrix, треугольная матрица

Я когда-то такое на Си реализовывал, в общем суть там такая, что отображение

(0,0) -> 0, (1,0) -> 1, (1,1) -> 2,
(2,0) -> 3, (2,1) -> 4, (2,2) -> 5,
(3,0) -> 6, (3,1) -> 7, (3,2) -> 8,
(3,3) -> 9, (4,0) ->10, (4,1) ->11

и я под это даже формулу вывел, давно это было. И так можно использовать одно число для хранения пары

SZT ★★★★★
(27.06.17 09:50:28 MSK)
Последнее исправление: SZT 27.06.17 09:52:55 MSK (всего исправлений: 1)

Ответ на: комментарий от SZT 27.06.17 09:50:28 MSK

Если пары никогда не одно число т.е. не может быть (0,0), (1,1) то тоже можно вывести формулу для такого отображения. Я в Maxima делал

SZT ★★★★★
(27.06.17 10:05:19 MSK)

Ссылка

разрешите с тривиальным решением влезть. спасибо =)

class MyTable:
    def __init__(self, s):
        self.forward = {}
        self.backward = {}
        for l in s.split('\n'):
            if l.strip():
                n, a, b = (int(x) for x in l.split())
                self.forward[n] = a,b
                self.backward[a,b] = n
    
    def __getitem__(self, key):
        if type(key) is int:
            return self.forward[key]
        else:
            return self.backward[key]

s = '''
    1 3 2
    2 4 3
    3 4 2
    4 5 3
    5 6 3
    6 32768 65536
'''

tab = MyTable(s)

print(tab[6])
print(tab[32768,65536])

$ python mytab.py
(32768, 65536)
6

anonymous
(27.06.17 11:15:43 MSK)

Ответ на: комментарий от anonymous 27.06.17 11:15:43 MSK

Я, к сожалению, питон не знаю. Так что, если можно в двух словах, поясните, в чем идея.

~~hotpil~~ ★★★★
(28.06.17 10:49:17 MSK) автор топика

Ответ на: комментарий от hotpil 28.06.17 10:49:17 MSK

суть описана в первом ответе

bvn13 ★★★★★
(28.06.17 11:14:09 MSK)

Ссылка

Ответ на: комментарий от hotpil 28.06.17 10:49:17 MSK

Дык ты напиши тогда какой язык интересует/ Не на битве экстрасенсов чай.

anonymous
(28.06.17 13:35:39 MSK)

Ответ на: комментарий от anonymous 28.06.17 13:35:39 MSK

Интересует идея алгоритма. Код на фортране пишется.

~~hotpil~~ ★★★★
(28.06.17 14:00:00 MSK) автор топика

Ответ на: комментарий от hotpil 28.06.17 10:49:17 MSK

та то два ассоциативных массива просто

anonymous
(28.06.17 15:04:11 MSK)

Ссылка

Ответ на: комментарий от hotpil 28.06.17 14:00:00 MSK

offtop

Для чего фортран используешь, если не секрет?

Aswed ★★★★★
(29.06.17 15:29:53 MSK)

Ответ на: offtop от Aswed 29.06.17 15:29:53 MSK

Ммм, для программирования

~~hotpil~~ ★★★★
(29.06.17 22:00:08 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Ошибка при линковке исполняемого файла

Development

Не могу осилить Gettext

→

offtop

Похожие темы